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I. Base du rapport 

1 . Ce rapport a ete redige sur la base des elements ci-apres {les feuHles de remplacement qui ont ete remises a 
I'office recepteur en reponse a une invitation faite conformement a I'article 14 sont considerees, dans le present 
rapport, comme "initialement deposees" et ne sont pas jointes en annexe au rapport puisqu'elles ne contiennent 
pas de modifications.) : 

Description, pages: 

1-74 version initiale 



Revendications, N"": 

1-41 version initiale 



Dessins, feuilies: 

1/60-60/60 



version initiale 



2. Les modifications ont entraine I'annulation : 

□ de la description, pages : 

□ des revendications, n°^ : 

□ des dessins, feuilies : 

3. □ Le present rapport a ete formuie abstraction faite (de certaines) des modifications, qui ont ete considerees 

comme allant au-dela de I'expose de invention tel qu'il a ete depose, comme il est indique ci-apres 
(regie 70.2(c)) : 



4. Observations complementaires, le cas echeant : 



11. Priorite 

1 . □ Le present rapport a ete fomiulee comme si aucune pnorite n'avait ete revendiquee, du fait que les 

documents suivants n'ont pas ete remis dans le delai prescrit : 

□ copie de la demande anterieure dont la priorite a ete revendiquee. 

□ traduction de la demande anterieure dont la pnorite a ete revendiquee, 

2. □ Le present rapport a ete fomiulee comme si aucune priorite n'avait ete revendiquee. du fait que la 
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revendication de la priorite a ete jugee non valable. 

Pour les besoins du present rapport, la date de depot international indiquee plus haut est done 
consideree comme la date pertinente. 

3. Observations complementaires, le cas echeant : 
voir feuille separee 

IV. Absence d'unite de ('invention 

1 . En reponse a I'invitation a limiter les revendications ou a payer des taxes additionnelles, le deposant a 

□ limite les revendications. 

□ paye des taxes additionnelles. 

□ paye des taxes additionnelles sous reserve. 

H ni limite les revendications ni paye des taxes additionnelles. 

2. □ L'administration chargee de I'examen preliminaire international estime qu'il n'est pas satisfait a I'exigence 

d'unite d'invention et decide, confomnement a la regie 68.1 , de ne pas inviter le deposant a limiter les 
revendications ou a payer des taxes additionnelles. 

3. L'administration chargee de I'examen preliminaire international estime que, aux termes des regies 13.1 ,13.2 et 
13.3, 

□ il est satisfait a I'exigence d'unite de invention. 

H il n'est pas satisfait a I'exigence d'unite de I'invention, et ce pour les raisons suivantes : 
voir feuille separee 

4. En consequence, les parties suivantes de la demande intemationale ont fait I'objet d'un examen preliminaire 
international lors de la formulation du present rapport : 

□ toutes les parties de la demande. 

H les parties relatives aux revendications n"^ 1-18,25-38,41. 
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V. Declaration motivee selon {'article 35(2) quant a la nouveaute, Tactivite inventive et la possibilite 
d'application industrielle; citations et explications a I'appui de cette declaration 

1. Declaration 

Nouveaute Oui : Revendications 

Non : Revendications 1-15,25-38,41 

Activite inventive Oui : Revendications 

Non : Revendications 16-18 

Possibilite d'application industrielle Oui ; Revendications 1-18,25-38,41 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VIII. Observations relatives a la demande Internationale 

Les observations suivantes sont faites au sujet de la clarte des revendications, de la description et des dessins 
et de la question de savoir si les revendications se londent entierement sur la description : 

voir feuille separee 
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Section I: Base du Rapport 

1 ) II est fait reference aux documents suivants: 

D1 : WO 97 23630 A (ABBOTT LAB) 3 juillet 1997 

D2: SWAN D G ET AL: 'Characterisation of a Streptomyces antibioticus gene 
encoding a type I polyketide synthase which has an unusual coding 
sequence.' MOLECULAR AND GENERAL GENETICS, (1994 FEB) 242 (3) 
358-62., XP002087278 

D3: DONADIO S ET AL: 'RECENT DEVELOPMENTS IN THE GENETICS OF 
ERYTHROMYCIN FORMATION' INDUSTRIAL MICROORGANISMS: BASIC 
AND APPLIED MOLECULAR GENETICS. ASM CONFERENCE ON THE 
GENETICS AND MOLECULAR BIOLOGY OF INDUSTRIAL 
MICROORGANISMS, 1992, pages 257-265, XP000607676 cite dans la 
demande 

D4: WO 97 06266 A (ABBOTT LAB) 20 fevrier 1997 

D5: HAYDOCK S F ET AL: 'CLONING AND SEQUENCE ANALYSIS OF GENES 
INVOLVE IN ERYTHROMYCIN BIOSYNTHESIS IN 
SACCHAROPOLYSPORA ERYTHAEA: SEQUENCE SIMILARITIES 
BETWEEN ERYG AND A FAMILY OF S-ADENOSYLMETHIONINE- 
DEPENDENT METHYLTRANSFERASES' MOL. GEN. GENET, vol. 230, no. 
1/02, novembre 1991, pages 120-128, XP002035888 cite dans la demande 

D6: WEBER J M ET AL: 'ORGANIZATION OF A CLUSTER OF 

ERYTHROMYCIN GENES IN SACCHAROPOLYSPORA ERYTHRAEA 
JOURNAL OF BACTERIOLOGY, vol. 172, no. 5, mai 1990, pages 2372- 
2383, XP002035891 cite dans la demande 

D7: CAFFREY, P. ET AL.: 'An acyl-carrier-protein-thioesterase domain from the 
6-deoxyerythronolide B synthase of Saccharopolyspora erythraea' 
EUROPEAN JOURNAL OF BIOCHEMISTRY, vol. 195, fevrier 1991, pages 
823-830, XP002061258 

D8: WO 91 16334 A (ABBOTT LAB) 31 octobre 1991 

D9: STASSI D ET AL: 'IDENTIFICATION OF A SACCHAROPOLYSPORA 

ERYTHRAEA GENE REQUIRED FOR THE FINAL HYDROXYLATION STEP 
IN ERYTHROMYCIN BIOSYNTHESIS" JOURNAL OF BACTERIOLOGY, vol. 
175, no. 1, janvier 1993, pages 182-189, XP000608396 cite dans la deman 
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de 

D10 LIU, H.-W. & THORSON, J.: 'Pathways and mechanisms in the biogenesis 
of novel deoxysugars by bacteria' ANNUAL REVIEW OF MICROBIOLOGY, 
vol. 48, 1994. pages 223-256, XP002061259 cite dans la demande 

Section II: Priorite (Article 8 PCT) 

2) Get examen est fonde sur I'hypothese que toutes les revendications jouissent d'un 
droit de priorite datant du depot du document de priorite. S*il s'averait qu'il n'en 
etait pas ainsi, les documents P, X cites dans le rapport de recherche 
Internationale pourraient devenir pertinents. 

Section IV: Absence d'unite de I'lnvention 

3) Unite d'invention (Article 34 (3)a) et Regies 13 et 68 PCT) 

3.1 L'administration chargee de la recherche international a trouve deux (groupes d') 
inventions dans la presente demande, a savoir: 

1. Les sequences d'ADN codant pour des proteines impliquees dans la 
biosynthese de I'erythromycine chez Saccharopolyspora, les polypeptides 
correspondant, leurs utilisations pour la synthese de metabolites 
secondaires hybrides ou comme sondes d'hybridation, et des souches 
modifiees dans I'un ou I'autre de ces genes. dTDP-D desosamine et ses sels 
(revendications 1-18, 25-38 et 41). 

2. Les sequences d'ADN comprenant des genes codant pour des proteines 
impliquees dans la biosynthese de I'oleomycine chez Streptomyces 
antibioticus, et leur utilisation dans un precede pour la preparation de 
precurseurs de I'oleandomycine (revendications 19-24, 39-40). 

3.2 L'autorite chargee de I'examen preliminaire est de I'opinion que cette demande ne 
satisfait pas a Texigence d'unite de I'invention, telle qu*elle est definie dans le 
reglement d'execution. 

Elle estime done que les inventions decrites ne sont pas liees par un seul concept 
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inventif general. 

3.3 Aucune taxe additionnelle n'a ete acquittee. C'est pourquoi I'examen preliminaire 
international est llmite a I'objet identifie sous le point 3.1.1 (revendications 1-18, 
25-38 et41). 

Section V: Declaration motivee selon la regie 66.2(a)(ii) quant a la nouveaute, 
I'activite inventive et la possibilite d'application industrielle; 
citations et explications h I'appui de cette declaration 

4) Nouveaute (Article 33 (2) PCT) 

4.1 D1 decrit I'identification de polynucleotides eryCII, eryBII. eryCIII, eryBIV, eryBV, 
eryCVI, eryBVI, eryCIV, eryCV et eryBVII de Saccharomyces erythraea impliques 
dans la biosynthese des polyketides glycosylees (voir SEQ ID N°1 and 2, Fig. 4A 
et B p.2 lignes 7-26; p.4 ligne 28 a p.5 ligne 4). D1 revendique des 
polynucleotides qui s'y hybrident, des polypeptides codes par ces sequences et 
des methodes pour la synthese de polyketides comprenant soit une modification 
de I'ADN responsable de la de la glycolysation (voir p.2 ligne 37 a p.3 ligne 15), 
soit une inversion de I'ADN ou fragment d'ADN et I'introduction de cet ADN dans 
un microorganisme capable de synthetiser des polyketides (voir p.3 second 
paragraphe), soit une introduction d'un ADN ou fragment d'ADN dans un 
microorganisme generant des polyketides avec une glycosylation alteree (p.3 
troisieme paragraphe). D1 decrit aussi introduction de genes alteres, codant pour 
eryB et/ou eryC dans un chromosome de Sac. erythraea afin de produire un 
polyketide glycosyle modifie (voir p. 15 derniere ligne-p.16 premier paragraphe; 
p. 17-1 9 et exemples 1-4). Enfin, dTDP-D-desosamine est illustre a la Fig. 3. 
Pour toutes ces raisons, I'enseignement de D1 anticipe I'objet des revendications 
1-15, 25-38 et 41. 

Le demandeur est prie de noter que le contenu des documents D3 a D10 anticipe 
ou suggere egalement tout ou partie des revendications 1-18, 25-38, 41 (voir D3 
p.258 col.2, 2nd paragraphe, p.259 col.1 2nd paragraphe, Fig. 3 et 4; D4 Fig.2; D5 
Fig.2 et p. 123 3eme paragraphe; D6 resume, Table I, Fig.4; D7 Fig.2; D8 Fig.7, 
etc.). 



Formulaire PCT/Feuille s6par6e/409 (feuille 3) (OEB-avril 1997) 



RAPPORT D*EXAMEN Demande intemationale n** PCT/FR98/01593 
PRELIMINAIRE INTERNATIONAL - FEUILLE SEPAREE 



5) Activite inventive (Article 33 (3) PCT) 

5.1 Une utilisation d'un fragment d'ADN comnae sonde est une application connue 
dans I'art anterieur. Elle ne peut etre consideree comme inventive qu'en 
association avec un ADN satisfaisant aux criteres de nouveaute et d'inventivite. 
En I'occurrence les sequences sont connues. Les revendications 16 et 17 ne sont 
done pas inventives. 

5.2 D2 mentionne que le gene ORFB de S. antibioticus code pour une polyketide 
synthase (PKS) et possede une grande similarite avec la troisieme sous-unite de 
la PKS impliquee dans la biosynthese de I'erythromycine (locus eryA) (voir 
resume). 

La personne du metier desireuse d'identifier des genes homologues de Sac. 
erythraea dans S. antibioticus aurait done utilise des sondes provenant des 
sequences identifiees dans Sac. erythraea (voir D1) pour isoler celles de S. 
antibioticus. L'utilisation de la revendication 18 est triviale. 

Section VIII : Observations relatives a la demande Internationale 

6) Clarte (Article 6 PCT) 

6.1 Les revendications 3 et 10 se rapportent a des sequences qui s'hybrident avec 
une sequence eryBII, eryCIII et eryCII ou eryBIV, eryBV, eryCVI, eryBVI, eryCIV, 
eryCV, eryBVI I. Les conditions d'hybridation sont pour I'instant indefinies et 
peuvent done se rapporter a des conditions de tres basse stringence. Uetendue 
de la protection recherchee n'est done pas claire. 

6.2 II n'existe pas de definition unique et reconnue dans I'art anterieur pour 
I'expression "homologie", la portee des revendications 3 et 10 est par consequent 
ambigue. II est fait remarquer que Tadjectif "significatif" est relatif. II ne clarifie en 
rien le terme "homologie". La meme remarque s'applique a toutes les 
revendications qui utilisent un tel terme. 

6.3 Le terme "fragment" utilise dans les revendications 3 et 10 n'est pas limite par une 
fonction definie. Un fragment capable d'initier une reponse immune peut done etre 
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interprete comme etant un tel fragment. L'objet des revendications 3 et 10 n'est 
done pas clair. 

6.4 Les revendications qui tentent d'identifier l'objet par Tintermediaire d'expressions 
internes ne sont pas claires (voir ORFx). Les expressions entre parentheses ne 
constituent pas des signes de reference au sens de la regie 6.2(b) PCT. Elles 
rendent I'etendue de la protection vague et indefinie. 

6.5 L*expression "analogue" est ambigue, puisqu'elle ne possede pas une definition 
unique dans I'art anterieur. Ce terme ne permet done pas de definir de fagon sur 
et precise Tetendue de la protection recherchee. Les revendications qui utilisent 
un tel terme sont obscures. 

6.6 Le precede des revendications 26 a 31 depend direetement ou indirectement de 
la revendication 25, mais les enzymes auxquelles ces revendications se referent 
ne sont pas identifies par leurs caracteristiques techniques structurales (ex: SEQ 
IDN°x). La meme remarque est valable pour les revendications 34 a 38. 

6.7 Les revendications 32 et 33 tentent de definir Tobjet pour lequel une protection est 
recherchee par le resultat a atteindre, en Toccurrence par le metabolite 
secondaire hybride a isoler. Ceci revient a enoncer le probleme a resoudre. Les 
caracteristiques techniques necessaires pour parvenir a ce resultat et resoudre le 
probleme doivent etre ajoutees afin de satisfaire aux conditions de clarte des 
revendications requises a Tarticle 6 PCT. 
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International application No. 
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International Patent Classification (IPC) or national classification and IPC 
C12N 15/52 
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1. 


This international preliminary examination report has been prepared by this International Preliminary Examining 
Authority and is transmitted to the applicant according to Article 36. 


2. 


This REPORT consists of a total of 9 sheets, including this cover sheet. 

1 1 This report is also accompanied by ANNEXES, i.e., sheets of the description, claims and/or drawings which have 
' — ' been amended and are the basis for this report and/or sheets containing rectifications made before this Authority 
(see Rule 70.16 and Section 607 of the Administrative Instructions under the PCT). 

These annexes consist of a total of sheets. 


3. 


This report contains indications relating to the following items: 




I m 


Basis of the report 




11 m 


Priority 




III □ 


Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 




IV 


Lack of unity of invention 






Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 




VI □ 


Certain documents cited 




VII □ 


Certain defects in the international application 




VIII lEI 


Certain observations on the international application 



Date of submission of the demand 

14 January 1999 (14.01.1999) 


Date of completion of this report 

15 December 1999 (15.12.1999) 


Name and mailing address of the IPEA/EP 
European Patent Office 
D-80298 Munich, Germany 

Facsimile No. 49-89-2399-4465 


Authorized officer 
Telephone No. 49-89-2399-0 
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International application No, 

PCT/FR98/01593 



1. Basis of the report 



1 . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article J 4 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.): 

I I the international application as originally filed. 

the description, pages ^'74 ^ as originally filed, 

pages , filed with the demand, 

pages , filed with the letter of 

pages , filed with the letter of 



the claims. 



Nos. 
Nos. 
Nos. 
Nos. 
Nos. 



1-41 



, as originally filed, 

, as amended under Article 19, 

, filed with the demand, 

, filed with the letter of 

, filed with the letter of 



the drawings, sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 



1/60-60/60 



, as originally filed, 
, filed with the demand, 
, filed with the letter of 
, filed with the letter of 



2. The amendments have resulted in the cancellation of: 

I I the description, pages 

I I the claims, Nos. 



I I the drawings, sheets/fig 



2 I I This report has been established as if (some oO the amendments had not been made, since they have been considered 
I — I gQ beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 



4. Additional observations, if necessary: 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



Intern^^^Tapplication No. 

PCT/FR 98/01593 



I. Basis of the report 

1. This i^rt has been dravvTi on tiie basis of fTtepteeme/tf^/ieete 

under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.) : 

1. The following documents are referred to herein: 

Dl: WO 97/23630 A (ABBOTT LAB) 3 July 1997 
D2 : SWAN D G ET AL: ^Characterisation of a 
Streptomyces antibioticus gene encoding a type I 
, polyketide synthase which has an unusual coding 
sequence', MOLECULAR AND GENERAL GENETICS, (1994 
FEB) 242 (3), 358-62, XP002087278 

D3: DONADIO S ET AL: 'RECENT DEVELOPMENTS IN THE 
GENETICS OF ERYTHROMYCIN FORMATION' , INDUSTRIAL 
MICROORGANISMS: BASIC AND APPLIED MOLECULAR 
GENETICS, ASM CONFERENCE ON THE GENETICS AND 
MOLECULAR BIOLOGY OF INDUSTRIAL MICROORGANISMS, 
1992, pages 257-265, XP000607676, cited in the 
application 

D4: WO 97/06266 A (ABBOTT LAB) 20 February 1997 
D5: HAYDOCK S F ET AL: "CLONING AND SEQUENCE 
ANALYSIS OF GENES INVOLVED IN ERYTHROMYCIN 
BIOSYNTHESIS IN SACCHAROPOLYSPORA ERYTHRAEA: 
SEQUENCE SIMILARITIES BETWEEN ERYG AND A FAMILY OF 
S-ADENOSYLMETHIONINE-DEPENDENT METHYLTRANSFERASES ' , 
MOL. GEN. GENET., vol. 2 30, no. 1/02, November 
1991, pages 120-128, XP002035888, cited in the 
application 

D6: WEBER J M ET AL: 'ORGANIZATION OF A CLUSTER OF 
ERYTHROMYCIN GENES IN SACCHAROPOLYSPORA ERYTHRAEA' , 
JOURNAL OF BACTERIOLOGY, vol. 172, no. 5, May 1990, 
pages 2372-2383, XP002035891, cited in the 
application 

D7 : CAFFREY, P. ET AL: 'An acyl-carrier-protein- 
thioesterase domain from the 6-deoxyerythronolide B 
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I. Basis of the report 

synthase of Saccharopolyspora erythraea' , EUROPEAN 
JOURNAL OF BIOCHEMISTRY, vol. 195, February 1991, 
pages 823-830, XP002061258 

D8: WO 91/16334 A (ABBOTT LAB), 31 October 1991 
D9: STASSI D ET AL: IDENTIFICATION OF A 
SACCHAROPOLYSPORA ERYTHRAEA GENE REQUIRED FOR THE 
FINAL HYDROXYLATION STEP IN ERYTHROMYCIN 
BIOSYNTHESIS', JOURNAL OF BACTERIOLOGY, vol. 175, 
no. 1, January 1993, pages 182-189, XP000608396, 
cited in the application 

DIO: LIU, H.-W. & THORSON, J.: 'Pathways and 
mechanisms in the biogenesis of novel deoxysugars 
by bacteria', ANNUAL REVIEW OF MICROBIOLOGY, vol. 
48, 1994, pages 223-256, XP002061259, cited in the 
application 
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(To be used when the space in any of the preceding boxes is not sufficient) 



Continuation of: 1 1 - 3 



Priority (PCT Article 8) 

The present examination is based on the assumption that 
all of the claims enjoy a right of priority as of the 
filing date of the priority document. Should this later 
prove not to be the case, the P" and ^^X" documents cited 
in the international search report might become relevant* 



Form PCT/IPEA/409 (Supplemental Box) (January 1994) 



• 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 

PCT/FR98/01593 



IV. Lack of unity of invention 



1. In response to the invitation to restrict or pay additional fees the applicant has: 
I I restricted the claims. 
I I paid additional fees. 
I I paid additional fees under protest. 

neither restricted nor paid additional fees. 



I I This Authority found that the requirement of unity of invention is not complied with and chose, according to Rule 68. 1 , 
2- I I not to invite the applicant to restrict or pay additional fees. 



3. This Authority considers that the requirement of unity of invention in accordance with Rules 13.1, 13.2 and 13.3 is 
I I complied with. 

DKI not complied with for the following reasons: 

See separate sheet. 



4. Consequently, the following parts of the international application were the subject of international preliminary examination 
in establishing this report: 

□ 

al! parts. 

[X] the parts relating to claims Nos. 1-18.25-38.41. 
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Unity of invention (PCT Article 34(3) (a) and PCT 
Rules 13 and 68) 

The International Searching Authority has found two 
(groups of) inventions in the present application, 
namely: 

1. The DNA sequences coding for proteins involved 
in erythromycin biosynthesis in Saccharopolyspora, 
the corresponding polypeptides, the uses thereof 
for synthesising hybrid secondary metabolites or as 
hybridisation probes, and modified strains of one 
of these genes. dTDP-D deosamine and salts thereof 
(claims 1-18, 25-38 and 41) . 

2. The DNA sequences including genes coding for 
proteins involved in oleomycin biosynthesis in 
Streptomyces antibioticus, and the use thereof in a 
method for preparing oleandomycin precursors 
(claims 19-24 and 39-40) . 

2- The Preliminary Examining Authority is of the 
opinion that the present application fails to 
comply with the requirement of unity of invention 
as defined in the Regulations. 
Therefore, it considers that the inventions 
described are not linked by a single general 
inventive concept . 

3, No additional fee has been paid. For this reason, 
the international preliminary examination has been 
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restricted to the subject matter identified in 
point 1.1 above (claims 1-18, 25-38 and 41). 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



Statement 
Novelty (N) 

Inventive step (IS) 
Industrial applicability (lA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-15, 25-38, 41 



16-18 



1-15, 25-38, 41 



YES 
NO 
YES 
NO 

YES 
NO 



Citations and explanations 

1. Novelty (PCT Article 33(2)) 



1.1 Dl describes the identification of polynucleotides 
eryCII, eryBII, eryCIII, eryBIV, eryBV, eryCVI, 
eryBVI, eryCIV, eryCV and eryBVII of Saccharomyces 
erythraea, involved in the biosynthesis of 
glycosylated polyketides (see SEQ ID NO 1 and 2, 
figures 4A and B, page 2, lines 7-26; page 4, line 
28 to page 5, line 4). Dl claims polynucleotides 
that hybridise, polypeptides encoded by these 
sequences and polyketide synthesis methods involving 
modification of the DNA responsible for 
glycosylation (see page 2, line 37 to page 3, line 
15), reversal of the DNA or DNA fragment and the 
insertion thereof into a microorganism capable of 
synthesising polyketides (see page 3, second 
paragraph) , or insertion of a DNA or DNA fragment 
into a microorganism generating glycosylation- 
modified polyketides (page 3, third paragraph) . Dl 
also describes the insertion of modified genes 
coding for eryB and/or eryC into a chromosome of 
Sac. erythraea, in order to produce a modified 
glycosylated polyketide (see page 15, last line to 
page 16, first paragraph; pages 17-19 and examples 
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1-4). Finally, dTDP-D-deosamine is shown in figure 
3. For all of these reasons, the teaching of Dl 
anticipates the subject matter of claims 1-15, 25-38 
and 41. 

The applicant is requested to note that the content 
of documents D3 to DIO also anticipates or suggests 
all of part of claims 1-18, 25-38 and 41 (see D3, 
page 258, column 2, second paragraph, page 259, 
column 1, second paragraph, figures 3 and 4; D4, 
figure 2; D5, figure 2 and page 123, third 
paragraph; D6, abstract. Table I, figure 4; D7, 
figure 2; D8, figure 7, etc). 

2. Inventive step (PCT Article 33(3)) 

2.1 The use of a DNA fragment as a probe is well known 
in the prior art and cannot be considered to be 
inventive unless it is combined with a DNA that 
complies the requirements of novelty and inventive 
step. In the present case, the sequences are known. 
Therefore, claims 16 and 17 are not inventive. 

2.2 D2 mentions that S. antibioticus gene ORFB codes for 
a polyketide synthase (PKS) and is very similar to 
the third PKS subunit involved in erythromycin 
biosynthesis (locus eryA) (see the abstract) • 

A person skilled in the art seeking to identify 
homologous genes of Sac. erythraea in S. 
antibioticus would thus have used probes from the 
sequences identified in Sac. erythraea (see Dl) to 
isolate those of S. antibioticus. The use according 
to claim 18 is trivial. 
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VIII. Certain observations on the international application 



The following observations on the clarity of the claims, description, and drawings or on the question whether the claims arc fully 
supported by the description, are made: 

1. Clarity (PCT Article 6) 



1.1 Claims 3 and 10 relate to sequences that hybridise 

with an eryBII, eryCIII and eryCII or eryBIV, eryBV^ 
eryCVI, eryBVI, eryCIV, eryCV, eryBVII sequence. The 
hybridisation conditions have yet to be defined and 
could thus be conditions of very low stringency. 
Therefore, the desired scope of protection is 
unclear - 



1.2 There is no single recognised definition in the 

prior art for the term "homology". As a result, the 
scope of claims 3 and 10 is ambiguous. It should be 
noted that the adjective '"significant" is relative 
and does not clarify the term "'homology" in any way. 
The same remark is applicable to all of the claims 
that use such a term. 



1-3 The term "'fragment" used in claims 3 and 10 is not 
restricted by a specific function. Any fragment 
capable of initiating an immune response may thus be 
considered to be such a fragment. It follows that 
the subject matter of claims 3 and 10 is unclear. 



1.4 Claims that attempt to identify subject matter by 
means of in-house expressions are unclear (see 
ORFx) . Expressions between parentheses do not 
constitute reference signs under the terms of PCT 
Rule 6.2(b), and render the scope of protection 
vague and undefined . 
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VIII. Certain observations on the international application 

1.5 The term '^equivalent" is ambiguous because it does 
not have a single definition in the prior art. 
Therefore, said term does not enable the desired 
scope of protection to be defined reliably and 
accurately. The claims in which such a term is used 
are obscure. 

1.6 The method of claims 26 to 31 is directly or 
indirectly dependent on claim 25, but the enzymes 
referred to in these claims have not been identified 
in terms of their structural technical features 
(e.g. SEQ ID NO x) . The same remark is applicable to 
claims 34 to 38, 

1.7 Claims 32 and 33 attempt to define the subject 
matter for which protection is sought in terms of 
the result to be achieved, in this case the hybrid 
secondary metabolite to be isolated. This merely 
amounts to stating the problem to be solved. To 
comply with the requirements of clarity of the 
claims set forth in PCT Article 6, the technical 
features required to achieve said result and solve 
the problem must be added. 
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VIII. Certain observations on the international application 



The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
Supported by the description, are made: 
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I. Base du rapport 

1 . Ce rapport a ete redige sur la base des elements ci-apres {les feuilles de remplacement qui ont ete remises a 
/'office recepteur en reponse a une invitation faite conformement a I'article 14 sont considerees, dans le present 
rapport, comme "initialement deposees" et ne sont pas jointes en annexe au rapport puisqu'eiles ne contiennent 
pas de modifications.) : 

Description, pages: 

1-74 version initiale 

Revendicatlons, N"": 

1 -41 version initiale 

Dessins, feuilles: 

1/60-60/60 version initiale 



2. Les modifications ont entraine I'annuiation ; 

□ de la description, pages: 

□ des revendicatlons, n°^ : 

□ des dessins, feuilles : 

3. □ Le present rapport a ete formule abstraction faite (de certaines) des modifications, qui ont ete considerees 

comme allant au-dela de I'expose de I'invention tel qu'il a ete depose, comme il est indique ci-apres 
(regie 70.2(c)) ; 

4. Observations complementaires, le cas echeant : 



M. Priorite 

1 . □ Le present rapport a ete formulee comme si aucune priorite n'avait ete revendiquee, du fait que les 

documents suivants n'ont pas ete remis dans le delai prescrit : 

□ copie de la demande anterieure dont la priorite a ete revendiquee. 

□ traduction de la demande anterieure dont la priorite a ete revendiquee. 

2. □ Le present rapport a ete formulee comme si aucune priorite n'avait ete revendiquee. du fait que la 
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revendication de la priorite a ete jugee non valable. 

Pour !es besoins du present rapport, !a date de depot international indiquee plus haut est done 
consideree comme la date pertinente. 

3. Observations complementaires, le cas echeant : 
voir feuille separee 

IV. Absence d'unite de Tinvention 

1 . En reponse a I'invitation a limiter les revendlcations ou a payer des taxes additionnelles, le deposant a 

□ limite les revendications. 

□ paye des taxes additionnelles. 

□ paye des taxes additionnelles sous resen/e. 

^ ni limite les revendications ni paye des taxes additionnelles. 

2. □ L'administration chargee de I'exannen preliminaire international estime qu'il n'est pas satisfait a I'exigence 

d'unite d'invention et decide, confomnement a la regie 68.1 , de ne pas inviter le deposant a limiter les 
revendications ou a payer des taxes additionnelles. 

3. L'administration chargee de I'examen preliminaire international estime que, aux termes des regies 13.1 ,13.2 et 
13.3, 

□ il est satisfait a I'exigence d'unite de I'invention. 

S il n'est pas satisfait a I'exigence d'unite de I'invention, et ce pour les raisons suivantes : 
voir feuille separee 

4. En consequence, les parties suivantes de la demande internationale ont fait I'objet d'un examen preliminaire 
international lors de la formulation du present rapport : 

□ toutes les parties de la demande. 

K les parties relatives aux revendications n°^ 1-18,25-38,41. 
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V. Declaration motivee selon I'article 35(2) quant a la nouveaute, Tactivite inventive et la possibilite 
d'application industrielle; citations et explications a I'appui de cette declaration 

1. Declaration 

Nouveaute Oui : Revendications 

Non : Revendications 1-15,25-38,41 

Activite inventive Oui : Revendications 

Non : Revendications 16-18 

Possibilite d'application industrielle Oui : Revendications 1-18,25-38,41 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VIII. Observations relatives a la demande Internationale 

Les obsen/ations suivantes sont faites au sujet de la clarte des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent entierement sur la description : 

voir feuille separee 
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Section I: Base du Rapport 

1) II est fait reference aux documents suivants: 

D1: WO 97 23630 A (ABBOTT LAB) 3 juillet 1997 

D2: SWAN D G ET AL: 'Characterisation of a Streptomyces antibioticus gene 
encoding a type I polyketide synthase which has an unusual coding 
sequence.' MOLECULAR AND GENERAL GENETICS, (1994 FEB) 242 (3) 
358-62., XP002087278 

D3: DONADIO S ET AL: 'RECENT DEVELOPMENTS IN THE GENETICS OF 
ERYTHROMYCIN FORMATION' INDUSTRIAL MICROORGANISMS: BASIC 
AND APPLIED MOLECULAR GENETICS. ASM CONFERENCE ON THE 
GENETICS AND MOLECULAR BIOLOGY OF INDUSTRIAL 
MICROORGANISMS, 1992, pages 257-265, XP000607676 cite dans la 
demande 

D4: WO 97 06266 A (ABBOTT LAB) 20 fevrier 1 997 

D5: HAYDOCK S F ET AL: 'CLONING AND SEQUENCE ANALYSIS OF GENES 
INVOLVE IN ERYTHROMYCIN BIOSYNTHESIS IN 
SACCHAROPOLYSPORA ERYTHAEA: SEQUENCE SIMILARITIES 
BETWEEN ERYG AND A FAMILY OF S-ADENOSYLMETHIONINE- 
DEPENDENT METHYLTRANSFERASES" MOL. GEN. GENET, vol. 230, no. 
1/02, novembre 1991, pages 120-128, XP002035888 cite dans la demande 

D6: WEBER J METAL: 'ORGANIZATION OF A CLUSTER OF 

ERYTHROMYCIN GENES IN SACCHAROPOLYSPORA ERYTHRAEA' 
JOURNAL OF BACTERIOLOGY, vol. 172, no. 5, mai 1990, pages 2372- 
2383, XP002035891 cite dans la demande 

D7: CAFFREY, P. ET AL.: 'An acyl-carrier-protein-thioesterase domain from the 
6-deoxyerythronolide B synthase of Saccharopolyspora erythraea' 
EUROPEAN JOURNAL OF BIOCHEMISTRY, vol. 195, fevrier 1991, pages 
823-830, XP002061258 

D8: WO 91 16334 A (ABBOTT LAB) 31 octobre 1991 

D9: STASSI D ET AL: "IDENTIFICATION OF A SACCHAROPOLYSPORA 

ERYTHRAEA GENE REQUIRED FOR THE FINAL HYDROXYLATION STEP 
IN ERYTHROMYCIN BIOSYNTHESIS' JOURNAL OF BACTERIOLOGY, vol. 
175, no. 1, janvier 1993. pages 182-189, XP000608396 cite dans la deman 
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de 

D10 LIU, H.-W. & THORSON, J.: 'Pathways and mechanisms in the biogenesis 
of novel deoxysugars by bacteria' ANNUAL REVIEW OF MICROBIOLOGY, 
vol. 48, 1994, pages 223-256, XP002061259 cite dans la demande 

Section II: Priorite (Article 8 PCT) 

2) Get examen est fonde sur I'hypothese que toutes les revendications jouissent d'un 
droit de priorite datant du depot du document de priorite. S'il s'averait qu'il n'en 
etait pas ainsi, les documents P, X cites dans le rapport de recherche 
Internationale pourraient devenir pertinents. 

Section IV: Absence d'unite de I'invention 

3) Unite d'invention (Article 34 (3)a) et Regies 13 et 68 PCT) 

3.1 L'administration chargee de ia recherche Internationale a trouve deux (groupes d") 
inventions dans ta presente demande, a savoir: 

1 . Les sequences d'ADN codant pour des proteines impliquees dans ta 
biosynthese de I'erythromycine chez Saccharopolyspora, les polypeptides 
correspondant, leurs utilisations pour la synthese de metabolites 
secondaires hybrides ou comme sondes d'hybridation, et des souches 
modifiees dans I'un ou I'autre de ces genes. dTDP-D desosamine et ses sels 
(revendications 1-18, 25-38 et 41). 

2. Les sequences d*ADN comprenant des genes codant pour des proteines 
impliquees dans la biosynthese de Toleomycine chez Streptomyces 
antibioticus. et leur utilisation dans un precede pour la preparation de 
precurseurs de I'oleandomycine (revendications 19-24, 39-40). 

3.2 L'autorite chargee de I'examen preliminaire est de I'opinion que cette demande ne 
satisfait pas a ['exigence d'unite de I'invention, telle qu'elle est definie dans le 
reglement d'execution. 

Elle estime done que les inventions decrites ne sont pas liees par un seul concept 
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inventif general. 

3.3 Aucune taxe additionnelle n'a ete acquittee. C'est pourquoi rexamen preliminaire 
international est limite a I'objet identifie sous le point 3.1.1 (revendications 1-18, 
25-38 et 41). 

Section V: Declaration motivee selon la regie 66.2(a)(ii) quant a la nouveaute, 
I'activite inventive et la possibilite d'application industrielle; 
citations et explications a Tappui de cette declaration 

4) Nouveaute (Article 33 (2) POT) 

4.1 D1 decrit ridentification de polynucleotides eryCII, eryBii, eryCIII, eryBIV, eryBV, 
eryCVI, eryBVI, eryCIV, eryCV et eryBVII de Saccharonnyces erythraea impliques 
dans la biosynthese des polyketides glycosyiees (voir SEQ ID N°1 and 2, Fig. 4A 
et B p. 2 lignes 7-26; p. 4 ligne 28 a p. 5 ligne 4). D1 revendique des 
polynucleotides qui s'y hybrident, des polypeptides codes par ces sequences et 
cles methodes pour la synthese de polyketides comprenant soit une modification 
de I'ADN responsable de la de la glycolysation (voir p. 2 ligne 37 a p. 3 ligne 15), 
soit une inversion de I'ADN ou fragment d'ADN et Tintroduction de cet ADN dans 
un microorganisme capable de synthetiser des polyketides (voir p. 3 second 
paragraphe), soit une introduction d'un ADN ou fragment d'ADN dans un 
microorganisme generant des polyketides avec une glycosylation alteree (p. 3 
troisieme paragraphe). D1 decrit aussi I'introduction de genes alteres, codant pour 
eryB et/ou eryC dans un chromosome de Sac. erythraea afin de produire un 
polyketide glycosyle modifie (voir p. 15 derniere ligne-p-16 premier paragraphe; 
p. 17-1 9 et exemples 1-4). Enfin, dTDP-D-desosamine est illustre a la Fig. 3. 
Pour toutes ces raisons, Tenseignement de D1 anticipe I'objet des revendications 
1-15, 25-38 et 41. 

Le demandeur est prie de noter que le contenu des documents D3 a D10 anticipe 
ou suggere egalement tout ou partie des revendications 1-18, 25-38, 41 (voir 03 
p. 258 coL2, 2nd paragraphe, p. 259 col.1 2nd paragraphe, Fig. 3 et 4; D4 Fig. 2; D5 
Fig. 2 et p. 123 3eme paragraphe; D6 resume, Table I, Fig. 4; D7 Fig. 2; D8 Fig. 7, 
etc.). 
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5) Activite inventive (Article 33 (3) PCT) 

5.1 Une utilisation d'un fragment d'ADN comme sonde est une application connue 
dans I'art anterieur. Elle ne peut etre consideree comme inventive qu'en 
association avec un ADN satisfaisant aux criteres de nouveaute et d'inventivite. 
En I'occurrence les sequences sont connues. Les revendications 16 et 17 ne sont 
done pas inventives. 

5.2 D2 mentionne que le gene ORFB de S. antibioticus code pour une polyketide 
synthase (PKS) et possede une grande similarity avec la troisieme sous-unite de 
la PKS impliquee dans la biosynthese de I'erythromycine (locus eryA) (voir 
resume). 

La personne du metier desireuse d'identifier des genes homologues de Sac. 
erythraea dans S. antibioticus aurait done utilise des sondes provenant des 
sequences identifiees dans Sac. erythraea (voir D1) pour isoler cedes de S. 
antibioticus. L'utilisation de la revendication 18 est triviale. 

Section VIII : Observations relatives a la demande Internationale 

6) Clarte (Article 6 PCT) 

6.1 Les revendications 3 et 10 se rapportent a des sequences qui s'hybrident avec 
une sequence eryBII, eryCIII et eryCll ou eryBIV, eryBV, eryCVI, eryBVI, eryCIV, 
eryCV, eryBVII. Les conditions d'hybridation sont pour I'instant indefinies et 
peuvent done se rapporter a des conditions de tres basse stringence. L'etendue 
de la protection recherchee n'est done pas claire. 

6.2 II n'existe pas de definition unique et reconnue dans Tart anterieur pour 
I'expression "homologie", la portee des revendications 3 et 10 est par consequent 
ambigue. II est fait remarquer que Tadjectif "significatif" est relatif. II ne clarifie en 
rien le terme "homologie". La meme remarque s'applique a toutes les 
revendications qui utilisent un tel terme. 

6-3 Le terme "fragment" utilise dans les revendications 3 et 10 n'est pas limite par une 
fonction definie. Un fragment capable d'initier une reponse immune peut done etre 
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interprete comme etant un tel fragment. L'objet des revendications 3 et 10 n'est 
done pas clair. 

6.4 Les revendications qui tentent d'identifier l'objet par rintermediaire d'expressions 
internes ne sont pas claires (voir ORFx). Les expressions entre parentheses ne 
constituent pas des signes de reference au sens de la regie 6.2(b) PCT. Elles 
rendent I'etendue de la protection vague et indefinie. 

6.5 L'expression "analogue" est ambigue, puisqu'elle ne possede pas une definition 
unique dans I'art anterieur. Ce terme ne permet done pas de definir de fa^on sur 
et precise I'etendue de la protection recherchee. Les revendications qui utilisent 
un tel terme sont obscures. 

6.6 Le precede des revendications 26 a 31 depend directement ou indirectement de 
la revendieation 25, mais les enzymes auxquelles ces revendications se referent 
ne sont pas identifies par leurs caracteristiques techniques structurales (ex: SEQ 
IDN°x). La meme remarque est vatable pour les revendications 34 a 38. 

6.7 Les revendications 32 et 33 tentent de definir l'objet pour lequel une protection est 
recherchee par le resultat a atteindre, en roccurrence par le metabolite 
secondaire hybride a isoler. Ceci revient a enoncer le probleme a resoudre. Les 
caracteristiques techniques necessaires pour parvenir a ce resultat et resoudre le 
probleme doivent etre ajoutees afin de satisfaire aux conditions de clarte des 
revendications requises a I'article 6 PCT. 
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(article 18 et regies 43 et 44 du PCT) 



Reference du dossier du deposant ou 
du mandataire 

2474/PCT 


POUR SUITE notification de transmission du rapport de recherche intemationale 
(fomiulaire PCT/ISA/220) et, le cas echeant, le point 5 ci-apres 

A DONNER 


Demahde intemationale n** 

PCT/FR 98/01593 


Date du depot international ^yoar/mo/s/annee^ 

21/07/1998 


(Date de priorite (ta plus ancienne) 
(jour/mois/annee) 

25/07/1997 


Deposant 

HOECHST MARION ROUSSEL et a1 . 



Le present rapport de recherche Internationale, etabli par Tadministration chargee de la recherche Internationale, est transmis au 
deposant con forme ment a I'article 18. Une copie en est transmise au Bureau international. 

Ce rapport de recherche intemationale comprend^ ^ feuilles. 

nn II est aussi accompagne d'une copie de chaque document relatif a I'etat de la technique qui y est cite. 



1 . Base du rapport 

a. En ce qui concerne ta langue, la recherche Internationale a ete effectuee sur la base de la demande Internationale dans la 
langue dans laquelle elle a ete deposee, sauf indication contraire donnee sous le meme point. 

I I la recherche Internationale a ete effectuee sur la base d'une traduction de la demande Internationale remise a I'administration. 

b. En ce qui conceme les sequences de nucleotides ou d*acldes amines divulguees dans la demande Internationale (le cas echeant), 
la re cherche intemationale a ete effectuee sur la base du listage des sequences : 

contenu dans la demande intemationaJe, sous forme ecrite. 
I X I deposee avec la demande intemationale, sous forme dechiffrable par ordinateur. 
I I remis ulterieurement a Tadministration, sous forme ecrite. 

remis ulterieurement a I'administration, sous forme dechiffrable par ordinateur. 



□ 
□ 

□ 



La declaration, selon laquelle le listage des sequences presente par ecrit et foumi ulterieurement ne vas pas au-dela de la 
divulgation faite dans la demande telle que deposee, a ete fournie. 

La declaration, selon laquelle les informations enregistrees sous forme dechiffrable par ordinateur sont identiques a celles 
du listage des sequences presente par ecrit, a ete fournie. 



I [ n a ete estime que certaines revendications ne pouvaient pas faire Tobjet d'une recherche (voir le cadre t). 
Pn II y a absence d*unite de I'lnvention (voir le cadre II). 



4. En ce qui concerne le titre, 

I X I te texte est approuve tel qu'tl a ete remis par le deposant. 

I I Le texte a ete etabli par I'administration et a la teneur suivante: 



En ce qui conceme Tabrege, 

["y^ le texte est approuve tel qu'il a ete remis par te deposant 

□ le texte (reproduit dans le cadre III) a ete etabli par I'administration conformement a ta regie 38.2b). Le deposant peut 
presenter des observations a Tadministration dans un delai d'un mois a compter de la date d'expedition du present rapport 
de recherche intemationale. 

La figure des dessins a publier avec I'abrege est la Figure n° 



I I suggeree par le deposant. [X| Aucune des figures 

□ , . , . , n'est a publier. 

parce que le deposant n a pas suggere de figure. , ^ 

I I parce que cette figure caracterise mieux I'invention. 
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Cadre I Observations - lorsqu'il a ete estime que certaines revendications ne pouvaient pas faire Tobjet d*une recherche 
(suite du point 1 de la premiere feuille) 



Conformement a Tarticle 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour les motifs suivants: 

1 . I ' I Les revendications . 

se rapportent a un objet a regard duquel radmtntstration n*est pas tenue de proceder a la recherche, a savoir: 



I I Les revendications n°® 

se rapportent a des parties de (a demande international qui ne remplissent pas suffisanriment les conditions prescrites pour 
qu'une recherche significative puisse etre effectuee, en particulier: 



3. I I Les revendications 

sont des revendications dependantes et ne spnt pas redigees conformement aux dispositions de (a deuxieme et de la 
troisieme phrases de la regie 6.4.a). 



Cadre II Observations - lorsqu'il y a absence d'unite de Tinvention (suite du point 2 de la premiere feuille) 



L'administration chargee de la recherche internationale atrouve plusieurs inventions dans la demande intemationale, a savoir: 



Voir feuille supplennentalre 



I X I Com me toutes les taxes addition nelles ont ete payees dans les delais par le deposant, le present rapport de recherche 
' ' internationale porte sur toutes les revendications pouvant faire I'objet d'une recherche. 



□ 



Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort particulier 
justifiant une taxe addltionnelle, l'administration n'a sollicite le paiement d'aucune taxe de cette nature. 



I Comme une partie seulement des taxes additionnelles demandees ia ete payee dans les delais par le deposant, le present 
' ' rapport de recherche internationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 



3. 

les revendications n °° 



4. I Aucune taxe additionnelle demandee n*a ete payee dans les delais par le deposant. En consequence, le present rapport 

' ' de recherche intemationale ne porte que sur I'invention mentionnee en premier lieu dans les revendications; elle est 

couverte par les revendications n **® 



Remarque quant a la reserve [ X | Les taxes additionnelles etaient accompagnees d'une reserve de la part du deposani 

I I Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 

L'admlnistration chargee de la recherche' Internationale a trouve plusieurs 
(groupe d') inventions dans la demande Internationale, a savoir : 

1. revendications: 1-18, 25-38 et 41 

Sequences d'ADN codant pour des proteines impliquees dans la 
blosynthese de 1 ' erythromycine chez Saccharopolyspora, les polypeptides 
correspondant, leurs utilisations pour la synthese de metabolites secon- 
daires hybrides ou comme sondes d'hybridation, et des souches modifiees 
dans I'un ou 1 'autre de ces genes. dTDP-D desosamine et ses sels. 

2. revendications: 19-24 et 39-40 

Sequence d'ADN comprenant des genes codants pour des proteines impliquees 
dans la biosynthese de I'oleomycine chez Streptomyces antibioticus,et 

leur utilisation dans un procede pour la preparation de precurseurs 

de 1 ' oleandomycine. 
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nde Intematlonate No 

r/FR 98/01593 



A. CLASSEMENT DE L'OBJET OE LA OEMANOE 

CIB 6 C12N15/52 C12P19/62 C12Qi/68 C12N1/20 //(C12N1/20, 
C12R1:01) 

Selon la class if ioation Internationale des bfevets (CIB) ou A la fois selon la classification nattonafe et ta CIB 



B. DOMAINES SUR LESQUELS LA RECHERCHE A PORTE 



Documentation nrdnimale consult^e (syst^nw de class ifieatton suivi des symboles de dassement) 

CIB 6 C12N C12P 



Documentation oonsu(t6e autre que la documentation minimale dans la mesure oCi. ces documents reinvent des domaines sur lesquels a port6 la recherche 



Base de donnees 6lectronique consutt^e au cours de la recherche Internationale (nom de ta base de donn^es, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie ° Identifioation des documents citds, avec, le cas ech^ant, Tindication des passages pertinents 



no. des revendications visees 



WO 97 23630 A (ABBOTT LAB) 3 juillet 1997 

voir figures 1,3,4A,4B,5 

voir page 2, ligne 37 - page 4, ligne 7 

voir page 10, ligne 3 - page 19, ligne 21 

voir exemples 

voir revendications 

SWAN D G ET AL: "Characterisation of a 

Streptomyces antibioticus gene encoding a 

type I polyketide synthase which has an 

unusual coding sequence." 

MOLECULAR AND GENERAL GENETICS, (1994 FEB) 

242 (3) 358-62., XP002O87278 

voir le document en entier 



-/- 



1-16, 
25-32.41 



17,18 
17,18 



Voir la suite du cadre C pour la fin de la liste des documents 



0 



Les documents de families de brevets sont Indiqu^ en annexe 



Categories sp^ciales de documents crtis: 

'A' document definissant T^tat g6n6raJ de ta technique, non 
consid6r6 com me particulidrement pertinent 

*E' document ant^rieur, mais public k la date de d^pdt intemational 
ou apres cette date 

"L' document pouvant jeter un doute sur une revendication de 
pnorite ou cit6 pour d^tenniner la date de publication cf une 
autre citation ou pour une raison sp^iale (telle qu'indtqu6e) 

*0' document se r§f6rant & une divulgatton oraie, ^ un usage, k 
une exposition ou tous autres moyens 

*P* document public avcmt la date de d^dt intemational, mais 
post^rieurement h la date de priority revendiquee 



"T" document ult6rieur public apr^s ta date de ddpdt intemational ou la 
date de priority et h'appartenenant pas k r6tat de ta 
technique pertinent, mais cit6 pour comprendre le principe 
ou la th6orie constituent la base de finvention 

'X* docunrrent partieuti^rement pertinent; Hnven tion revendiquee ne peut 
§tre consid6r6e comme nouvelle ou com me imptiquant une activity 
inventive par rapport au document consider^ isot^nrent 

'Y* document particutidrement pertinent; I'lnven tion revendiquee 

ne peut Stre eonsider^e comme impliquant une activity inventive 
lorsque le document est associe k un ou plusieurs autres 
documents de mSme nature, cette combinaison etant ^vidente 
pour une person ne du metier 

'&* document qui fait partie de la m§me famitle de brevets 



Date a laquelte la recherche intemationale a ete effeetivement achevee 



11 mars 1999 



Date d'expedition du present rapport de recherche intemationale 



13. 04. 1999 



Nom et adresse postale de radministration chargde de la recherche intemationale 
Offioe Europ^en des Brevets, P.B. 5818 Patenttaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl. 
Fax: (+31-70)340-3016 



Fonctionnaire autorisd 



Andres, S 
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C.(sujte) DOCUMENTS CONSIDERESCOMME PERTINENTS 


Cat^orie 


Identification des documents clt6s, avec,le cas 6ch6ant, I'lndicatlondes passages pertinents 


no. des revendications via^es 


X 


OONADIO S ET AL: "RECENT DEVELOPMENTS IN 
THE GENEtlCS OF ERYTHROMYCIN FORMATION" 
INDUSTRIAL MICROORGANISMS: BASIC AND 
APPLIED MOLECULAR GENETICS. ASM CONFERENCE 

UIM Int ucNbllLo MNU MULtLULAR BIOLOGY OF 

INDUSTRIAL MICROORGANISMS, 1992, pages 

257-265, XPO006O7676 

cite dans la demande 

vu 1 1 ic uui^umcnt en enLicr 


26-28,32 


X 


wo 97 06266 A (ABBOTT LAB) 20 fevrier 1997 
voir exemple 1 
voir figure 2 


10,12,13 


X 


HAYDOCK S F ET AL: "CLONING AND SEQUENCE 
ANALYSIS OF GENES INVOLVE IN ERYTHROMYCIN 
BIOSYNTHESIS IN SACCHAROPOLYSPORA 
ERYTHAEA: SEQUENCE SIMILARITIES BETWEEN 
ERYG AND A FAMILY OF 
S-ADENOSYLMETHIONINE-DEPENDENT 
METHYLTRANSFERASES" 

Mfll f^FW f^FMFT 
nUL. UtIIM. VjiCIvLI , 

vol. 230, no. 1/02, novembre 1991, pages 
120-128, XP0O2035888 
cite dans la demande 
voir figure 2 


1-7 


X 


WEBER J M ET AL: "ORGANIZATION OF A 
CLUSTER OF ERYTHROMYCIN GENES IN 

SACCHAROPOLYSPORA ERYTHRAEA" 

iniiDKiAi nc DArTiTDTni nrv 
JUUKNAL Ur dAU 1 LKlULUuT , 

vol. 172, no. 5, mai 1990, pages 

2372-2383, XP0O2035891 

cite dans la demande 

voir le document en entier 


1.2,28, 
29 


X 


CAFFREY, P. ET AL.: "An 
, acyl-carrier-protein-thioesterase domain 
from the 6-deoxyerythronol ide B synthase 
of Saccharopolyspora erythraea" 
PiiDnpPAiM .in iDMAi nr RTnru™TQTDv 

vol. 195, fevrier 1991, pages 823-830, 

XP0O2O61258 

voir figures 2,3 

voir page 827, colonne de gauche 


3,5,6 


X 


WO 91 16334 A (ABBOTT LAB) 31 octobre 1991 
voir exemple 3 
voir figure 7 


3,5,6 
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C.(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Cat^gorie Identification des documents cit^s, avecje cas ^cheant, I'indicationdes passages pertinents 



no. des revendicattons visees 



STASSI D ET AL: "IDENTIFICATION OF A 

SACCHAROPOLYSPORA ERYTHRAEA GENE REQUIRED 

FOR THE FINAL HYDROXYLATION STEP IN 

ERYTHROMYCIN BIOSYNTHESIS" 

JOURNAL OF BACTERIOLOGY, 

vol. 175, no. 1, janvier 1993, pages 

182-189, XPO005O8396 

cite dans la demande 

voir figures 2,5 

LIU. H.-W. & THORSON, J.: "Pathways and 

mechanisms in the biogenesis of novel 

deoxy sugars by bacteria" 

ANNUAL REVIEW OF MICROBIOLOGY, 

vol. 48, 1994, pages 223-256, XPOO2061259 

cite dans la demande 

voir page 229, ligne 5 - page 232 

voir page 236, ligne 28 - page 237, ligne 
9 

voir page 250 
voir figure 9 

QUIROS, L. & SALAS, J.: "Biosynthesis of 
the macrolide oleandomycin by Streptomyces 
antibioticus" 

JOURNAL OF BIOLOGICAL CHEMISTRY, (1995 AUG 
4) 270 (31) 18234-9.. 

vol. 270. 4 aout 1995, pages 18234-18239, 
XP002096256 

voir le document en entier 

MALPARTIDA F ET AL: "Homology between 
Streptomyces genes coding for synthesis of 
different polyketides used to clone 
antibiotic biosynthetic genes" 
NATURE. 

vol. 325. 26 fevrier 1987, pages 818-821, 
XP002075972 

voir le document en entier 

KAO, C. ET AL.: "Engineered biosynthesis 
of a complete macrolactone in a 
heterologous host" 
SCIENCE. 

vol. 265. 22 juillet 1994. pages 509-512, 

XP002096257 

voir abrege 

voir page 511, cblonne de gauche, alinea 2 
- colonne de droite, derniere ligne 

-/— 



8,9 



41 



1.8. 
25-32 



19,20 



17,18 



39,40 



Formutaire PCT/ISA/210 (suite de ladeuxidme teuille) (juillet 1992) 



page 3 de 4 



RAPPORT DE RECi 



HE INTERNATIONALE 



\e Internationale No 

7FR 98/01593 



C.(sulte) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie ** Identification des documents cit^s, avec,le cas ^cheant, rindicationdes passages pertinents 



no. des revertdi cations visees 



P.x 



P,x 



p.x 



p.x 



SUMMERS R G ET AL: "Sequencing and 
mutagenesis of genes from the erythromycin 
biosynthetic gene cluster of 
Saccharopolyspora erythraea that are 
involved in L-mycarose and D-desosamine 
production" 

MICROBIOLOGY-UK. (OCT 1997) VOL. 143. PART 
10, PP. 3251-3262.. XP002O61260 
voir le document en entier 

SALAH-BEY K ET AL: "Targeted gene 
inactivation for the elucidation of 
deoxysugar biosynthesis in the 
erythromycin producer Saccharopolyspora 
erythraea. " 

MOLECULAR AND GENERAL GENETICS, (1998 MAR) 
257 (5) 542-53., XPOO2087277 
voir le document en entier 

GAISSER S ET AL: "Analysis of seven genes 
from the eryAl-eryK region of the 
erythromycin biosynthetic gene cluster in 
Saccharopolyspora erythraea" 
MOLECULAR & GENERAL GENETICS. (OCT 1997) 
VOL. 256, NO. 3, PP. 239-251.. XPO02061261 
voir le document en entier 

GAISSER, S. ET AL. : "Analysis of eryBI. 
eryBIII and eryBVII from the erythromycin 
biosynthetic gene cluster in 
Saccharopolyspora erythraea" 
MOLECULAR AND GENERAL GENETICS., 
vol, 258, avril 1998, pages 78-88, 
XP002087279 

voir le document en entier 

OLANO C ET AL: "Analysis of a 
Streptomyces antibioticus chromosomal 
region involved in oleandomycin 
biosynthesis, which encodes two 
glycosyl transferases responsible for 
glycosylation of the macrolactone ring." 
MOLECULAR AND GENERAL GENETICS. (1998 AUG) 
259 (3) 299-308., XP0O2096258 
voir le document en entier 



1-16, 
25-32,41 



1-16, 
25-32 



8-16, 
25-32,41 



8-10,12, 
13,15,28 



19-24, 
39,40 



Formulaire PCT/ISA/210 (suite de ladeuxt^me feuille) (juillet 1992) 



page 4 de 4 



RAPPORT DE RECI 

Rensefgnements relatif s aux 



CHE INTERNATIONALE 

s de families de brevets 



m 



nde Intemationafe No 

/FR 98/01593 



Document brevet cite 
au rapport de recherche 



Date de 
publication 



Membre{s) de la 
famille de brevet (s) 



Date de 
publication 



wo 


9723630 


A 


03-07-1997 


EP 


0874548 


A 


04-11-1998 


wo 


9706266 


A 


20-02-1997 


CA 


2201481 


A 


20-02-1997 










EP 


0783584 


A 


16-07-1997 










JP 


10507087 


T 


14-07-1998 


wo 


9116334 


A 


31-10-1991 


US 


5141926 


A 


25-08-1992 










CA 


2080583 


A 


19-10-1991 










EP 


0525083 


A 


03-02-1993 










JP 


2587562 


B 


05-03-1997 










JP 


5504890 


T 


29-07-1993 










KR 


9608668 


B 


28-06-1996 










PT 


97390 


A 


31-01-1992 



Formulaire PCT/ISA/210 (annexe tamiltes de brevets) (juiltet 1992) 



INTERNATIC^P- SEARCH REPORT 




Int tiona Application No 

PCT/FR 98/01593 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 6 C12N15/52 C12P19/62 C12Q1/68 C12N1/20 //(C12N1/20. 
C12R1:01) 

According to Intemalional Patent Classification (IPC) or to both national classification and IPC 



B. FIELDS SEARCHED 



Minimum documentation searched (classification system foUowed by classification symbols) 
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Genes de biosvnthese et de transfer^ des S-desoxyhexoses chez 
s^cchajrooolvspajra ejrytjrraea et chez StreptomYces antlbl otlaus 
et leur utilisaliion, 

5 La presente invention decrit des genes . impliques dans la 

biosynthese et le transfert des 6-desoxyhexoses chez 
Smccharopolyspora erythraea et leur utilisation dans la 
production d' analogues de 1' erythromycine par manipulation 
genetique . 

10 L'erythromycine A est un antibiotique inacrolide 

cliniquement important produit par la bacterie gram-positive 
Sac. Brythraea, Les genes de la biosynthese de l^erythromy- 
cine sont organises en un cluster de genes, ery qui inclut 
aussi le gene d' auto-resistance a 1 ' erythromycine erjnE. 

15 Le cluster ery contient les trois grands genes eryAI , 

eryAII et eryAIII (locus eryA) codant pour trois polypeptides 
composant la polyketide synthetase (denommee PKS) flanques 
par deux regions comprenant les genes impliques dans les 
stades ulterieurs de conversion du noyau lactone 

20 (6-desoxyerythronolide B) en erythromycine A. 

Pendant le processus de biosynthese de 1 ' erythromycine A 
represents a la figure 1, la biosynthese des 6-desoxyhexoses 
comprend 1' ensemble des reactions enzymatiques conduisant du 
glucose-l-phosphate au sucre active final dTDP-L-mycarose ou 

25 dTDP-D-desosamine . Le dTDP-L-mycarose ou la dTDP-D-desosamine 
ainsi produits sont ensuite utilises comme substrats pour le 
transfert des deux despxyhexoses sur le noyau lactone. La 
formation de 1 ' erythromycine requiert 1 ' attachement du myca- 
rose vi'a 1' hydroxy le en position C-3 du noyau lactone et 

3 0 1 ' attachement de la desosamine via 1' hydroxy le en position 

C-5, L'ensemble des genes eryB impliques dans la biosynthese' 
ou le transfert du mycarose et 1' ensemble des genes eryC 
impliques dans la biosynthese ou le transfert de la desosa- 
mine n'ont pas encore ete clairement identifies. 
35 Le cluster ery d'une longueur de 56 kb comprend 21 

phases ouvertes de lecture ou "open reading frames" (ORFs) 
dont la numerotation a ete etablie par Haydock et al . (1991) 
et Donadio et al. (1993). Le locus eryA comprend les ORFs 10, 
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11 et 12 • 

Des travaux precoces d' interruption ou de r emplacement 
de gene dans la partie gauche du cluster ery a permis une 
premiere identification du gene eryCI (ORFl) (Dhillon et al., 
5 1989), puis du gene eryBI (ORF2), du locus eryH (ORFs 3 , 4 et 
5) dont 1' inactivation conduit a la production de 
6-desoxyerythronolide B, d'un locus eryBII (ORFs 7 et 8) et 
le gene eryCII (Weber et al., 1990). 

Parmi les activites enzymatiques impliquees dans les 
10 modifications ulterieures du noyau lactone ont ete 

identifiees le gene eryF (ORF4) responsable de I'hydroxyla- 
tion en C6 (Weber et al., 1991) et le gene eryK (ORF20) 
responsable de 1 'hydroxy lat ion en C12 (Stassi et al. , 1993). 
D' autre part, le gene eryG (ORF6) responsable de la 
15 O-methylation du mycarose en cladinose (position 3"0H) a ete 
identifie (Weber et al., 1989). L' erythromycine A est ainsi 
formee via 1 ' erythromycine B ou 1 ' erythromycine C a partir de 
1 ' erythromycine D selon le schema propose (figure 1) . 

La caracterisation f onctionnelle des genes eryB et eryC 
20 situes sur la partie droite de cluster ery (ORFs 13 a 19) n'a 
pas encore ete etablie de fagon precise, malgre les 
informations parcellaires communiquees dans differents 
articles de revues (Donadio et al., 1993 ; Liu et Thorson, 
1994 ; Katz et Donadio, 1995) . 
25 En raison de I'interet commercial des antibiotiques 

macrolides, I'obtention de nouveaux derives, notamment 
I'obtention d' analogues de 1 ' erythromycine ayant des 
proprietes avantageuses , est intensivement recherchee, Les 

modifications peuvent etre desirees dans la partie aglycprie 

30 (macrolactone) ou/et dans son hydroxylation secondaire ainsi 
que dans la partie sucre (cladinose et/ou desosamine) de 
1 ' erythromycine . 

Les methodes courantes telles que les modifications 
chimiques sont difficiles et limitees vis-a-vis du type de 
3 5 produit que I'on peut obtenir a partir de 1 ' erythromycine. 
Par exemple, Sakakibara et al. (1984) passent en revue des 
modifications chimiques realisees a partir de 1 ' erythromycine 
A ou B, aussi bien dans la partie sucre que dans la macro- 
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lactone. 

Des modifications de la macro lactone de 1' erythromycine 
A par manipulation genetique du microorganisme Sac. erythraea 
ont ete decrites dans la demande de brevet Internationale 
5 WO 93/13663 ainsi que I'obtention de nouvelles molecules 
polyketides par alterations genet iques specif iques du locus 
eryA du chromosome codant pour la PKS. Par exemple la 
7-hydroxyerythromycine A, la 6-desoxy-7-hydroxyerythromycine 
A ou le 3-oxo-3-desoxy-5-desoaminyl-erythronolide A ont ete 

10 ainsi obtenus. 

La presents invention concerne la caracterisation 
f onctionnelle de dix genes de Sac. erythraea impliques dans 
la biosynthese ou 1 ' attachement du mycarose et de la desosa- 
mine (eryBII, eryCIII et eryCII situes en aval du locus eryA 

15 et eryBIV, eryBV, eryCVI, eryBVI, eryCIV, eryCV et eryBVII 
situes en amont) , leur utilisation dans la production 
d'analogues de 1 ' erythromycine ainsi qu'un precede de 
preparation de ceux-ci. 

La presente invention a done pour objet une sequence 

20 d'ADN simple ou double brin isolee, representee a la figure 2 
(sequence directe et complementaire de SEQ ID N° 1) corres- 
pondant a la region eryG-eryAIII du cluster de genes de la 
biosynthese de 1 ' erythromycine et a particulierement pour 
objet une sequence d'ADN ci-dessus comprenant : 

25 - la sequence eryBII correspondant a 1'0RF7 .(sequence comple- 
mentaire de SEQ ID N° 1 du nucleotide 48 au nucleotide 1046) 
et codapt pour une dTDP-4-ceto-L-6-desoxyhexdse 2/3-reduc- 
tase, 

- la sequence eryCIII correspondant a I'ORFB (sequence — 
30 complementaire de SEQ ID N° 1 du nucleotide 1046 au nucleo- 
tide 2 3 08) et codant pour une desosaminyltransf erase et 

- la sequence eryCII correspondant a l'ORF9 (sequence comple- 
mentaire de SEQ ID N° 1 du nucleotide 2322 au nucleotide 

34 04) et codant pour une dTDP-4-ceto-D-6-desoxyhexose 
35 3 , 4-isomerase. 

La sequence d'ADN ci-dessus montree a la figure 2 est 
une sequence d'ADN genomique qui peut etre obtenue par 
exemple par sous-clonage de fragments de restriction d'un 
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fragment d'ADN genomique de Sac. Grythraea, selon des 
conditions operatoires dont une description detaillee est 
donnee plus loin. 

invention a plus particulierement pour objet une 
5 sequence d'ADN isolee representee a la figure 2 choisie parmi 
la sequence eryBII correspondant a l'ORF7 (sequence comple- 
mentaire de SEQ ID 1 du nucleotide 48 au nucleotide 1046) , 
la sequence eryCIII correspondant a I'ORFS (sequence comple- 
mentaire de SEQ ID N** 1 du nucleotide 1046 au nucleotide 

10 2 3 08) ou la sequence eryCII correspondant a l'ORF9 (sequence 
coinplementaire de SEQ ID N*' 1 du nucleotide 2322 au nucleo- 
tide 3404) et les sequences qui hybrident et/ou presentent 
des homologies signif icatives avec cette sequence ou des 
fragments de celle-ci et ayant la meme fonction. 

15 L' invention a tout particulierement pour objet la 

sequence d'ADN isolee eryCIII representee a la figure 2 
correspondant a I'ORFS (sequence complementaire de SEQ ID 
N** 1 du nucleotide 104 6 au nucleotide 23 08 = sequence comple- 
mentaire de SEQ ID N° 4) et codant pour une desosaminyl- 

20 transferase. 

La sequence eryBII correspondant a l'ORF7 code pour un 
polypeptide ayant 3 33 acides amines (sequence de SEQ ID 
N° 2) , la sequence eryCIII correspondant a I'ORFS code pour 
un polypeptide ayant 421 acides amines (sequence de SEQ ID 

25 N° 5) et la sequence eryCII correspondant a .1'0RF9 code pour 
un polypeptide ayant 3 61 acides amines (sequence de SEQ ID 
N*^ 3) . 

L'a mise en evidence des activites enzymatiques respecti- 
ves indiquees ci-dessus a ete realisee par introduction d'une 
3 0 deletion interne au gene correspondant telle qu'illustree 
plus loin dans la partie experimentale. 

Par sequences qui hybrident et ayant la meme fonction, 
on inclut les sequences d'ADN qui hybrident avec I'une des 
sequences d'ADN ci-dessus sous des conditions standards de 
3 5 stringence elevee ou moyenne decrites par Sambrook et al. 

(1989) et qui cedent pour une proteine ayant la meme fonction 
enzymatique. Par meme fonction enzymatique, on entend une 
activite enzymatique donnee sur des substrats de meme nature. 
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par exemple un dTDP-6-desoxyhexose ou une macrolactone nue ou 
glycosylee. Les conditions de forte stringence comprennent 
par exemple une hybridation a 65 »C pendant 18 heures dans une 
solution 5 X SSPE, 10 x Denhardt, 100 fig/ml DNAss, 1 % SDS 
5 suivie de 2 lavages pendant 20 minutes avec une solution 

2 X SSC, 0,05 % SDS a 65«C suivis d'un dernier lavage pendant 
45 minutes dans une solution 0,1 x SSC, 0,1 % SDS a 65*^0. Les 
conditions de stringence moyenne comprennent par exemple un 
dernier lavage pendant 2 0 minutes dans une solution 0,2 x 

10 SSC, 0,1 % SDS a 65*»C, 

Par sequences qui presentent des homologies significa- 
tives et ayant la meme fonction, on inclut les sequences 
ayant une identite de sequence nucleotidique d'au moins 60 % 
avec I'une des sequences ADN ci-dessus et qui cedent pour une 

15 proteine ayant la meme fonction enzymatique. 

L' invention a aussi pour objet un polypeptide code par 
I'une des sequences d'ADN ci-dessus et a specialement pour 
objet un polypeptide correspondant a une ORF representee a la 
figure 2, choisie parmi 1'0RF7 (ayant la sequence de SEQ ID 

2 0 N** 2), I'ORFS (ayant la sequence de SEQ ID N° 5) ou l'ORF9 
(ayant la sequence de SEQ ID 3) et les analogues de ce 
polypeptide. 

Par analogues, on inclut les peptides ayant une sequence 
en acides amines modifiee par substitution, deletion ou 
25 addition d'un ou plusieurs acides amines pour autant que ces 
produits conservent la meme fonction enzymatique. Les 
sequences modifiees peuvent etre par exemple. preparees en 
utilisant la technique de mutagenese dirigee connue de 
I'homme du metier. 
30 L' invention a plus specialement pour objet le poly- 

peptide correspondant a I'ORF 8 representee a la figure 2 
(ayant la sequence de SEQ ID N° 5) et ayant une activite 
desosaminyltransf erase, denomme EryCIII. 

invention decrit une proteine recombinante EryCIII de 
3 5 Sac. erythraea obtenue par expression dans une cellule hote 
selon les methodes connues de genie genetique et de culture 
cellulaire. 

L'obtention de la proteine recombinante purifiee a 
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permis de confirmer la caracterisation de la fonction 
glycosyltranf erase associee au produit du gene eryCIII dans 
un "test in vitro qui met en evidence le transfert du sucre 
active dTDP-D-desoisamine sur le noyau lactone. 
5 L' invention a aussi pour objet la thymidine 5'-(tri- 

hydrogene diphosphate) , P' - [ 3 , 4 , 6-tridesoxy-3- (dimethylamino) - 
D-.xylo.-hexopyranosyl] ester (dTDP-D-desosamirte) et les sels 
d' addition avec les bases, dont un exemple de preparation est 
decrit. plus loin dans la partie experimentale, 

10 L' invention a aussi pour objet une sequence d'ADN isolee 

representee a la figure 3 (sequence de SEQ ID N*^' 6) corres- 
pondant a la region eryAI-eryK du cluster de genes de la 
biosynthese de 1 ' erythromycine et a particulierement pour 
objet une sequence d'ADN ci-dessus comprenant : 

15 - la sequence eryBIV correspondant a l'ORF13 (sequence de SEQ 
ID N*' 6 du nucleotide 242 au nucleotide 1207) et codant pour 
une dTDP-4 -ceto-L-6-desoxyhexose 4 -reductase , 

- la sequence eryBV correspondant a l'ORF14 (sequence de SEQ 
ID N** 6 du nucleotide 1210 au nucleotide 2454) et codant pour 

20 une mycarosyltransf erase, 

- la sequence eryCVI correspondant a I'ORFIS (sequence de SEQ 
ID N° 6 du nucleotide 2510 au nucleotide 3220) et codant pour 
une dTDP-D-6-desoxyhexose 3-N-methyltransf erase , 

- la sequence eryBVI correspondant a l'ORF16 (sequence de SEQ 
25 ID N° 6 du nucleotide 3308 au nucleotide 4837) et codant pour 

une dTDP-4-ceto-L-6-desoxyhexose 2, 3-deshydratase, 

- la sequence eryCIV correspondant a l'ORF17. (sequence de SEQ 
ID N° '6 du nucleotide 4837 au nucleotide 6039) et codant pour 
une dTDP-D-6-desoxyhexose 3 , 4-deshydratase , 

30 - la sequence eryCV correspondant a I'ORFIS (sequence de SEQ 
ID N° 6 du nucleotide 6080 au nucleotide 7546) et codant pour 
une dTDP-D-4., 6-didesoxyhexose 3 , 4-reductase et 

- la sequence eryBVII correspondant a l'ORF19 (sequence de 
SEQ ID N° 6 du nucleotide 7578 au nucleotide 8156) et codant 

35 pour une dTDP-4 -ceto-D-6-desoxyhexose 3,5 epimerase. 

La sequence d'ADN ci-dessus montree a 'la figure 3 est 
une sequence d'ADN genomique qui peut etre obtenue, par 
exemple, par sous-clonage de fragments de restriction de 
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cosmides contenant une banque d'ADN genomique de Sac. 
erythraBSL, selon des conditions operatoires dont une 
description detaillee est donnee plus loin. 

L' invention a plus particulierement pour objet une 
5 sequence d'ADN isolee representee a la figure 3 choisie parmi 
la sequence eryBIV correspondant a l'ORF13 (sequence de SEQ 
ID 6 du nucleotide 242 au nucleotide 1207) , la sequence 
eryBV correspondant a 1'0RF14 (sequence de SEQ ID 6 du 
nucleotide 1210 au nucleotide 2454), la sequence eryCVI 

10 correspondant a I'ORFIS (sequence de SEQ ID N° 6 du nucleo- 
tide 2510 au nucleotide 3220) , la sequence eryBVI correspon- 
dant a I'ORFie (sequence de SEQ ID 6 du nucleotide 3 3 08 au 
nucleotide 4 8 37) , la sequence eryCIV correspondant a l'ORF17 
(sequence de SEQ ID N° 6 du nucleotide 4837 au nucleotide 

15 6039) , la sequence eryCV correspondant a I'GRFIB (sequence de 
SEQ ID 6 du nucleotide 6080 au nucleotide 7546) ou la 
sequence eryBVII correspondant a l'ORF19 (sequence de SEQ ID 
N° 6 du nucleotide 7578 au nucleotide 8156) et les sequences 
qui hybrident et/ou presentent des homologies signif icatives 

2 0 avec cette sequence ou des fragments de celle-ci et ayant la 

meme fonction. 

L' invention a tout particulierement pour objet la 
sequence d'ADN isolee eryBV representee a la figure 3 
correspondant a l'ORF14 (sequence de SEQ ID N° 6 du nucleo- 
25 tide 1210 au nucleotide 2454) et codant pour une mycarosyl- 
transf erase. 

La, sequence eryBIV correspondant a l'ORF13 code pour un 
polypeptide ayant 322 acides amines (SEQ ID N° 7) , la 
sequence eryBV correspondant a l'ORF14 code pour un polypep— 

3 0 tide ayant 415 acides amines (SEQ ID N° 8), la sequence 

eryCVI correspondant a I'ORFIS code pour un polypeptide ayant 
2 37 acides amines (SEQ ID N° 9) , la sequence eryBVI corres- 
pondant a l'ORF16 code pour un polypeptide ayant 510 acides 
amines (SEQ ID 10) , la sequence eryCIV correspondant a 
35 l'ORF17 code pour un polypeptide ayant 401 acides amines (SEQ 
ID N** 14) , la sequence eryCV correspondant a I'ORFIS code 
pour un polypeptide ayant 489 acides amines (SEQ ID N'^' 11) et 
la sequence eryBVII correspondant a l'ORF19 code pour un 
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polypeptide ayant 193 acides amines (SEQ ID N** 12) • 

La mise en evidence des activites enzymatiques respec- 
tives indiquees ci-dessus a ete realisee par introduction 
d'une deletion interne au gene correspondant telle 
5 qu'illustree plus loin dans la partie experimentale. 

Les sequences d'ADN qui hybrident ainsi que les 
sequences d'ADN qui presentent des homologies signif icatives 
et ayant la meitie fonction ont la meme signification que celle 
indiquee precedemment • 

10 L' invention a aussi pour objet un polypeptide code par 

I'une des sequences d'ADN ci-dessus et a specialement pour 
objet un polypeptide correspondant a une ORF representee a la 
figure 3, choisie parmi l'ORF13 (ayant la sequence de SEQ ID 
N° 7), l'ORF14 (ayant la sequence de SEQ ID N° 8), I'ORFIS 

15 (ayant la sequence de SEQ ID N° 9) , 1'0RF16 (ayant la 

sequence de SEQ ID N** 10) , I'ORFIV (ayant la sequence de SEQ 
ID N° 14) , I'ORFIS (ayant la sequence de SEQ ID N*' 11) ou 
l'ORF19 (ayant la sequence de SEQ ID N° 12) et les analogues 
de ce peptide. 

20 Les analogues du polypeptide ont la meme signification 

que celle indiquee precedemment • 

L' invention a plus specialement pour objet le poly- 
peptide correspondant a l'ORF14 representee a la figure 3 
(ayant la sequence de SEQ ID N° 8) et ayant une activite 

2 5 mycarosyltransf erase, denomme EryBV, 

La connaissance de chaque sequence d'ADN eryB ou eryC de 
1' invention indiquee ci-dessus et montree a la figure 2 ou a 
la figure 3 permet de reproduire la presente invention par 
exemple par des methodes connues de synthese chimique ou - psT ~^ 

3 0 criblage d'une banque genomique a I'aide de sondes 

d' oligonucleotides de synthese par les techniques connues 
d'hybridation ou par amplification par PCR. 

Les polypeptides de 1' invention peuvent etre obtenus par 
les methodes connues, par exemple par synthese chimique ou 
3 5 par la methodologie de I'ADN recombinant par expression dans 
une cellule hote procaryote ou eucaryote. 

Un autre objet de 1' invention concerne 1 'utilisation 
d'au moins I'une des sequences d'ADN choisie parmi les 



wo 99/05283 



PCT/FR98/01593 



9 

sequences eryBII (sequence complementaire de SEQ ID N° 1 du 
nucleotide 48 au nucleotide 1046) , ejryCIII (sequence comple- 
mentaire de SEQ ID 1 du nucleotide 1046 au nucleotide 
23 08) ou er-yCII (sequence complementaire de SEQ ID N** 1 du 
5 nucleotide 2322 au nucleotide 3404) representees a la figure 
2, eryBIV (sequence de SEQ ID N** 6 du nucleotide 24 2 au 
nucleotide 1207), eryBV (sequence de SEQ ID N*' 6 du nucleo- 
tide 1210 au nucleotide 2454), eryCVI (sequence de SEQ ID 
N«» 6 du nucleotide 2510 au nucleotide 3220) , eryBVI (sequence 
10 de SEQ ID N*' 6 du nucleotide 3308 au nucleotide 4837) , eryCIV 
(sequence de SEQ' ID N«* 6 du nucleotide 4837 au nucleotide 
6039) , eryCV (sequence de SEQ ID 6 du nucleotide 6080 au 
nucleotide 754 6) ou eryBVII (sequence de SEQ ID 6 du 

nucleotide 7578 au nucleotide 8156) representees a la 
15 figure 3, pour synthetiser des metabolites secondaires 
hybrides chez Sac. erythraBa. 

Par metabolites secondaires hybrides, on entend soit des 
analogues de 1 ' erythromycine , c'est-a-dire des derives de 
I'erythromycine ayant une ou plusieurs modifications portant 
2 0 sur la partie sucre et possedant une activite antibiotique, 
soit des precurseurs de 1 ' erythromycine tels que le 6- 
desoxyerythronolide B ou 1 ' erythronolide B auxquels sont 
attaches un ou plusieurs residus sucre modifies ou non et ne 
possedant pas d' activite antibiotique . Le residu sucre 
25 modifie peut etre par exemple, le 4-ceto-L-mycarose . 

La synthese de metabolites secondaires hybrides chez 
Sac, erythraBa par utilisation de sequences d'ADN eryB ou 
eryC de 1' invention peut etre realisee par exemple, par 
1' inactivation d'un ou plusieurs genes eryB ou er-yC ci-de ssu^ - 
30 et 1' introduction d'un ou plusieurs genes exogenes ou de 

leurs derives obtenus par exemple par mutagenese, ayant des 
sequences nucleotidiques codant pour des enzymes ayant la 
meme fonction chez des souches productrices d'autres 
macrolides, par exemple la tylosine, la picromycine ou la 
35 methymycine. En particulier, 1 ' introduction de genes exogenes 
peut etre effectuee par integration d'une sequence d'ADN 
obtenue selon la methodologie du "DNA shuffling" (Stemmer, 
1994) ou par la construction d'une sequence d'ADN chimere,par 



wo 99/05283 



PCT/FR98/01593 



10 

exemple a partir d'une sequence eryB ou eryC de 1' invention 
intervenant dans le transfert d'un residu sucre, par exemple 
la sequence eryCIII ou eryBV, et de genes homologues isoles a 
partir de souches productrices de macrolides, par exemple 
5 StrBptomyces fradiae^ Streptomyces olivaceus^ Streptomyces 
venezuelaB ou StrBptomycBs antlbioticus . 

L' invention concerne aussi 1 'utilisation d'au moins 
I'une des sequences d'ADN choisie parmi les sequences eryBII 
(sequence complementaire de SEQ ID N° 1 du nucleotide 48 au 

10 nucleotide 1046), eryCIII (sequence complementaire de SEQ ID 
N° 1 du nucleotide 1046 au nucleotide 2308) ou eryCII 
(sequence complementaire de SEQ ID N° 1 du nucleotide 2322 au 
nucleotide 3404) representees a la figure 2, eryBIV (sequence 
de SEQ ID N*' 6 du nucleotide 242 au nucleotide 1207) , eryBV 

15 (sequence de SEQ ID 6 du nucleotide 1210 au nucleotide 

2454), eryCVI (sequence de SEQ ID N° 6 du nucleotide 2510 au 
nucleotide 322 0) , eryBVI (sequence de SEQ ID N° 6 du 
nucleotide 3308 au nucleotide 4837), eryCIV (sequence de SEQ 
ID N° 6 du nucleotide 4837 au nucleotide 6039) , eryCV 

20 (sequence de SEQ ID N° 6 du nucleotide 6080 au nucleotide 

7546) ou eryBVII (sequence de SEQ ID N° 6 du nucleotide 7578 
au nucleotide 8156) representee a la figure 3 ou d'un 
fragment de cette sequence, comme sondes d ' hybridation . 

Les sequences d'ADN eryB ou eryC de 1' invention peuvent 

25 etre utilisees pour constituer des sondes d'hybridation d'au 
moins 19 nucleotides, permettant d'isoler des genes homo- 
logues iians des souches productrices de macrolides en 
utilisant les methodes classiques d' hybridation d'acides 
nucleiques immobilisees sur des f litres ou d' amplification 

3 0 par PGR, selon les conditions decrites par Sambrook et al, 
(1989) . 

L' invention concerne particulierement 1 'utilisation de 
la sequence d'ADN eryCIII representee a la figure 2 (sequence 
complementaire de SEQ ID N° 1 du nucleotide 1046 au nucleo- 
35 tide 2308 = sequence complementaire de SEQ ID N° 4) comme 
sonde d' hybridation pour isoler des genes hbmologues 
responsables de la . glycosylation de la macrolactone chez une 
souche productrice de macrolide. 
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invention concerne plus particulierement 1 'utilisation 
ci-dessus, dans laquelle les genes homologues sont les genes 
de la biosynthese de 1' oleandomycine chez S. antlbioticus . 

L' invention decrit, a titre d'exemple, I'utilisation de 
5 la sequence du gene eryCIII coitone sonde d' hybridation pour 
isoler des genes homologues dans une souche productrice 
d' oleandomycine. La sonde eryCIII utilisee a permis d' isoler 
les genes oleGl et oleG2 codant pour des glycosyltransf erases 
Chez S. antlbioticus impliquees dans le transfert de la 
10 desosamine et de I'oleandrose sur le noyau lactone. 

La caracterisation f onctionnelle des genes oleGl et 
oleG2 a permis de definir 1 ' organisation de la partie droite 
du cluster des genes de la biosynthese de 1 ' oleandomycine 
chez S. antibioticus , 
15 L' invention a done pour objet une sequence d'ADN isolee 

representee a la figure 22 (sequence de SEQ ID N° 15) corres- 
pondant a une region du cluster de genes de la biosynthese de 
1' oleandomycine comprenant : 

- la sequence correspondant a I'ORF olePl du nucleotide 184 
20 au nucleotide 1386, 

- la sequence correspondant a I'ORF oleGl du nucleotide 14 37 
au nucleotide 2714 codant pour une activite glycosyltrans- 
ferase, 

- la sequence correspondant a I'ORF oleG2 du nucleotide 2722 
25 au nucleotide 3999 codant pour une activite glycosyltrans- 

f erase, 

- la sequence correspondant a I'ORF oleM du nucleotide 3992 
au nucleotide 4720 (= sequence de SEQ ID N° 20) et 

- la sequence correspondant a I'ORF oleY du nucleotide 4810— 
30 au nucleotide 5967. 

La sequence d'ADN ci-dessus montree a la figure 22 
(sequence de SEQ ID N° 15) est une sequence d'ADN genomique 
qui peut etre obtenue par exemple a partir d'un cosmide 
couvrant la partie droite du cluster de genes de la biosyn- 
35 these de 1 ' oleandomycine par hybridation avec une sonde 

eryCIII, selon les conditions operatoires dbnt une descrip- 
tion detaillee est donnee plus loin. 

L' invention a plus particulierement pour objet une 
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sequence d'ADN isolee representee a la figure 22 choisie 
parmi la sequence correspondant a I'ORF oleGl (sequence de 
SEQ ID N*=* 15 du nucleotide 1437 au nucleotide 2714 codant 
pour une activite glycosyltransf erase et la sequence 
5 correspondant a I'ORF oIeG2 (sequence de SEQ ID N° 15 du 

nucleotide 2722 au nucleotide 3999) codant pour une activite 
glycosyltransf erase . 

invention a tout particulierement pour objet une 
sequence d'ADN isolee ci-dessus correspondant a I'ORF oleGl 

10 (sequence de SEQ ID N° 15 du nucleotide 1437 au nucleotide 
2714) codant pour une activite desosaminyltransf erase, ainsi 
qu'une sequence d'ADN isolee ci-dessus correspondant a I'ORF 
oIeG2 (sequence de SEQ ID N*' 15 du nucleotide 2722 au 
nucleotide 3999) codant pour une activite oleandrosyl- 

15 transferase. 

La sequence correspondant a I'ORF oleGl code pour un 
polypeptide ayant 426 acides amines (sequence de SEQ ID 
N** 17) et la sequence correspondant a I'ORF oIeG2 code pour 
un polypeptide ayant 426 acides amines (sequence de SEQ ID 

20 N° 18) . 

La mise en evidence des activites enzymatiques respec- 
tives indiquees ci-dessus a ete realisee par alteration du 
gene correspondant telle qu'illustree plus loin dans la 
partie experimentale . 
25 L' invention a aussi pour objet le polypeptide code par 

la sequence d'ADN correspondant a I'ORF oleGl et ayant une 
activite desosaminyltransf erase (sequence de SEQ ID N° 17) et 
le polypeptide code par la sequence d'ADN correspondant a 
I'ORF oIeG2 et ayant une activite oleandrosyltransf erase"'^'^ 
3 0 (sequence de SEQ ID N° 18) • 

Les polypeptides ci-dessus denommes respectivement OleGl 
et 01eG2 peuvent etre obtenus par les methodes connues 
indiquees ci-dessus, 

L' invention a aussi pour objet un precede de preparation 
3 5 de metabolites secondaires hybrides chez Sac. erythraea dans 
lequel : 

- on isole une sequence ADN contenant au moins une sequence 
eryB ou une sequence eryC du cluster de genes de la bio- 
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synthase de 1 ' erythromycine representee a la figure 2 
(sequence compleinentaire de SEQ ID N** 1) ou a la figure 3 
(sequence de SEQ ID N*^6) , 

- on cree une modification dans la dite sequence et on 
5 obtient une sequence alteree, 

- on integre la sequence alteree dans le chromosome de la 
souche hote et on obtient une souche modifiee, 

- on cultive la souche modifiee dans des conditions 
permettant la formation du metabolite secondaire hybride et 

10 - on isole le metabolite secondaire hybride. 

La modification de la sequence d'ADN peut etre realisee 
par exemple par une addition et/ou par une deletion de 
sequences d'ADN d'au moins un nucleotide, dans une sequence 
eryB ou eryC de 1' invention qui code pour I'une des enzymes 

15 correspondantes indiquees ci-dessus. 

L' integration de la sequence alteree dans la souche hote 
peut etre realisee par exemple par la methodologie de la 
recombinaison homologue qui peut etre ef f ectuee selon le 
schema montre a la figure 4 et conduit a la generation de 

2 0 mutants chromosomiques de souches *Sac. erythraea que I'on 
cultive ensuite selon les methodes generales connues de 
culture cellulaire . 

li' invention a particulierement pour objet le precede ci- 
dessus dans lequel la sequence ADN code pour I'une des 

2 5 enzymes choisie parmi une 

- dTDP-4-ceto-D-6-desoxyhexose 2, 3-reductase, 

- desosaminyltransf erase, 

- dTDP-4-ceto-D-6-desoxyhexose 3 , 4- isomer ase, 

- dTDP-4-ceto-Ij-6-desoxyhexose 4 -reductase, 

3 0 - mycarosyltransf erase, --^ — 

- dTDP-D-6-desoxyhexose 3-N-methyltransf erase, 

- dTDP-4-ceto-L-6-desoxyhexose 2 , 3-deshydratase, 

- dTDP-D-6-desoxyhexose 3 , 4-deshydratase , 

- dTDP-D-4 , 6-didesoxyhexose 3 , 4-reductase ou 
3 5 - dTDP-4-ceto-D-6-desoxyhexose 3,5 epimerase. 

L' invention a plus particulierement pour objet le 
precede ci-dessus dans lequel 1' alteration de la sequence 
resulte dans 1 ' inactivation d'au moins I'une des enzymes 
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indiquees ci-dessus . 

inactivation d'au moins I'une des enzymes est mise en 
evidence, d'une part par 1' absence de production 
d'erythromycine, d' autre part par 1 ' accumulation de precur- 
5 seurs de 1 ' erythromycine tels que le 6-desoxyerythronolide B, 
I'erythronolide B ou le 3-a-mycarosyl erythronolide B et/ou 
1' accumulation de metabolites secondaires hybrides tels que 
definis precedemment dans les surnageants de cultures des 
souches modifiees correspondantes . 

10 L' invention concerne tout particulierement le precede 

ci-dessus dans lequel 1' enzyme inactivee est une dTDP-4-ceto- 
L-6-desoxyhexose 4 -reductase ou dans lequel 1' enzyme 
inactivee est une dTDP-D-6-desoxyhexose 3 , 4-deshydratase ou 
dans lequel 1' enzyme inactivee est une mycarosyltransf erase 

15 ou dans lequel 1' enzyme inactivee est une dTDP-4-ceto-L-6- 
desoxyhexose 2 , 3 -reductase. 

L' invention concerne aussi le precede ci-dessus dans 
lequel le metabolite secondaire hybride isole est un analogue 
de 1 ' erythromycine choisi parmi la 4 "-ceto-erythromycine, la 

20 4 ' -hydroxy-erythromycine ou la 3"-C desmethyl-2 " , 3 "-ene- 

erythromycine ou dans lequel le metabolite secondaire hybride 
isole est le desosaminyl erythronolide B. 

Des exemples de mise en oeuvre du precede de 1' invention 
sont donnes dans la partie experimentale . L' accumulation de 

25 metabolites secondaires hybrides dans des souches de 

Sac. erythraea modifiees est egalement decrite plus loin. 

L' invention concerne aussi une souche de. Sac, erythraea 
modifiee dans laquelle au moins I'une des enzymes choisie 
parmi une 

30 - dTDP-4-ceto-L-6-desoxyhexose 2 , 3-reductase, " 

- desosaminyltransf erase , 

- dTDP-4-ceto-D-6-desoxyhexose 3 , 4-isomerase , 

- dTDP-4-ceto-L-6-desoxyhexose 4-reductase, 

- mycarosyltransf erase, 

35 - dTDP-D-6-desoxyhexose 3-N-methyltransf erase, 

- dTDP-4-ceto-L-6-desoxyhexose 2 , 3-deshydrat*ase, 

- dTDP-D-6-desoxyhexose 3 , 4-deshydratase , 

- dTDP-D-4 , 6-didesoxyhexose 3", 4-reductase ou 
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- dTDP-4-ceto-D-6-desoxyhexose 3,5 epimerase 

est inactivee et produisant au moins un metabolite secondaire 
hybride. 

L' invention concerne particulierement la souche de Sac. 
5 erythraea modifiee BII92 dans laquelle une dTDP-4-ceto-L-6- 
desoxyhexose 2 , 3-reductase est inactivee et produisant la 
3«'-C desmethyl-2" , 3"-ene-erythromycine C, la souche de Sac- 
ejrythjraea modifiee BIV87 dans laquelle une dTDP-4-ceto-L-6- 
desoxyhexose 4-r4ductase est inactivee et produisant la 4"- 

10 ceto-erythromycine, la souche de Sac. erythrasa modifiee 

CIV89 dans laquelle une dTDP-D-6-desoxyhexose 3 , 4-deshydra- 
tase est inactivee et produisant la 4 ' -hydroxyerythromycine D 
ainsi que la souche de Sac. erythraea modifiee BV88 dans 
laquelle une mycarosyltransf erase est inactivee et produisant 

15 du desoaminyl erythronolide B. Des constructions detaillees 
des souches ci-dessus sont donnees plus loin dans la partie 
exper imentale . 

L' invention concerne aussi un precede de preparation de 
precurseurs de 1 ' oleandomycine chez S. antibioticus dans 
20 lequel 

- on cree une alteration de la sequence du gene choisie parmi 
la sequence d'ADN correspondant a I'ORF oleGl (sequence de 
SEQ ID N° 15 du nucleotide 1437 au nucleotide 2714) 

et la sequence d'ADN correspondant a I'ORF oleG2 (sequence 
25 de SEQ ID N° 15 du nucleotide 2722 au nucleotide 3999) dans 
le chromosome d'une souche hote et obtient une souche 
modifiee, 

- on cultive la souche modifiee dans des conditions 
permettant 1 ' accumulation des precurseurs de 1 ' oleandomycine-^ 

30 et 

- on isole ces precurseurs. 

li' alteration de la sequence d'ADN peut etre realisee par 
exemple par interruption du gene cible dans la souche 
S. antibioticus, par exemple par integration d'un plasmide 
3 5 par la methodologie de la recombinaison homologue et conduit 
a la generation de mutants chromosomiques de la souche 
sauvage. 

L' invention concerne particulierement un precede ci- 
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dessus dans lequel 1' alteration est creee dans la sequence 
d'ADN correspondant a I'ORF oleGl (sequence de SEQ ID N** 15 
du nucleotide 1437 au nucleotide 2714) et dont il resulte au 
moins 1' elimination de I'activite desoaminyltransf erase et 
5 1^ accumulation du precurseur de 1 ' oleandomycine 
8 , 8a-desoxyoleandolide. 

L' accumulation d'un precurseur non glycosyle de 
1' oleandomycine 8 , 8a-desoxyoleandolide observee par interrup- 
tion du gene oleGl est due a un effet polaire transcription- 
10 nel inactivant le gene oIeG2. 

Un exemple de mise en oeuvre du precede ci-dessus est 
donne plus loin dans la partie experimentale . 

Materiels et methodes generales. 

15 1. Souches bacteriennes , plasmides et conditions de crois- 
sance. 

La souche Sac. erythrasa utilises pour la realisation de 
1' invention est un variant phenotypique spontane dit "red 
variant" (Hessler et al., 1997) de la souche sauvage 
2 0 Sac. erythjraBa NRRL 233 8 dont la croissance est effectuee en 
routine soit sur milieu solide R2T2 (milieu R2T decrit par 
Weber et al., 1985 sans peptone), R2T20 (Yamamoto et al,, 
1986) ou Ml-102 sur agar (Kaneda et al,, 1962), soit en 
milieu liquids TSB (Oxoid) a 30°C. 

2 5 La souche StrGptomyces lividans 13 2 6 (John Innes Culture 

Collection) decrite par Hopwood et al. (1983) , utilises pour 
la preparation de plasmides depourvus d'origine de replica- 
tion d'^ Escherichia coli tels que pIJ7 02 et pIJ48 6, a ete 
maintenue sur milieu solide R2YE(R5) (Hopwood et al., 19 8 5j . 

3 0 La croissance des souches coli XLl-blue (Stratagene) , 

JMllO (Stratagene) et DH5q;.MCR (GibcoBRL) , utilisees pour les 
preparations de plasmides, a ete effectuee en routine en 
milieu liquide 2 x YT ou LB ou en milieu solide LB sur agar, 
tels que decrits par Sambrook et al. (1989). La souche 
3 5 E. coli XLl-blue est utilisee pour les clonages en routine. 
La souche JMllO est utilisee pour des clonages oCl I'on 
utilise des sites de restriction tels que Bcil . La souche 
DH5a.MCR est utilisee pour 1^ preparation de plasmides 
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destines a etre introduits chez Sac. Brythraea pour une 
transformation optimale. 

La selection des plasmides dans E, coll a ete effectuee 
sur ampicilline (Sigma) a 100 ^tg/ml, 
5 Les souches Bacillus subtilis ATCC 6 63 3 ou Bacillus 

pumilus ATCC 14 884 ont ete utilisees comme souches indica- 
trices pour evaluer la production d'erythromycine dans des 
essais biologiques par antibiogramme . 

Les plasmides Litmus28, pUClS et pUC19 (New England 

10 Biolabs) ont ete utilises en routine pour les sbus-clonages . 
Le vecteur pIJ702 (Katz et al., 1983) a ete obtenu du John 
Innes Institute. Le vecteur pIJ486 (Ward et al., 1986) a ete 
obtenu de C.J. Thompson (Universite. de Bale, Suisse) . Le 
phagmide pTZlSR a ete obtenu de Pharmacia Biotech. Le vecteur 

15 navette coli-streptomyces pUWL218 (Wehmeier, 1995) utilise 
pour 1' integration chromosomique dans Sac. erythraea a ete 
obtenu de W. Piepersberg (Universite.de Wuppertal, Allemagne) . 

2. Manipulation de I'ADN et sequengage. 

Les methodes generales de biologie moleculaire utilisees 
20 sont decrites par Sambrook et al., 1989. 

Les reactif s d ' origine commerciale ont ete utilises 
incluant les enzymes de restriction (New England Biolabs et 
Boehringer Mannheim), le fragment de Klenow de I'ADN 
polymerase I (Boehringer Mannheim) . La trousse "DNA ligation 
25 system" (Amersham) a ete utilisee pour effectuer les 

ligations et la trousse Plasmid Midi kit (Quiagen) ou RPM kit 
(BiolOl Inc.) pour purifier I'ADN plasmidique. 

La preparation de I'ADN du bacteriophage X a ete 
realisee selon Ausubel et al. (1995) et I'isolement de 1 'ADN— - 
3 0 chromosomique de Sac. erythraea selon Hopwood et al. (198 5) . 
La transformation de S. lividans et I'isolement des 
plasmides ont ete effectues selon Hopwood et al. (1985) . 

3. Preparation de 1 ' erythronolide B et du 3-Q;-mycarosyl 
erythronolide B. 

35 L' erythronolide B et le 3-cit-mycarosyl erythronolide B 

ont ete purifies a partir d'extraits de culture du mutant 
eryCI (clone WHB2221 decrit par Dhillon et al., 1989) par 
chromatographie sur gel d ' aminopropyl (LichroprepNH2 25-4 0 ^, 
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Merck) avec un gradient d'elution par des melanges chlorure 
de butyle/chlorure de methylene successifs (100:0, 80:20, 
50:50 et 20:80) suivi d'un gradient d'elution lineaire par le 
melange chlorure de butyle/methanol variant de 99:1 a 90:10, 
5 Les fractions contenant les produits attendus sont amenees a 
sec sous vide puis analysees par chromatographie en couche 
mince (ccm) . L' erythronolide B est ensuite cristallise dans 
un melange acetate d' ethyle/hexane puis recristallise dans 
I'ethanol. Le 3-a-mycarosyl erythronolide B est cristallise 
10 deux fois dans un melange acetate d' ethyle/hexane. 
Milieux cites. 

1, R2T2 : 

Pour 1 litre de solution aqueuse : sucrose 103 g ; K2SO^ 

0,2 5g ; extrait de levure 6,5 g ; tryptone 5,0 g ; bactoagar 

15 22,0 g ; eau distillee qsp 860 ml. La solution est steri- 
lisee par autoclavage pendant 3 0 minutes a 12 0 **C. Au moment 
de I'utilisation, les solutions steriles suivantes sont 
ajoutees : 20 ml de glucose a 50 % ; 25 ml de Tris-HCl IM, 
pH7,0 ; 5 ml de KH2PO4 a 0,5 % ; 2 , 5 ml de NaOH IN ; 50 ml 

20 de CaCl2 IM ; 50 ml de MgCl2,6H20 IM et 2 ml de solution de 
"trace elements" (Hopwood et al., 1985). 

2. R2T20 : 

Pour un litre de solution aqueuse : milieu R2T2 contenant 

2 06 g de sucrose • 
25 3. Ml-102 (Kaneda et al., 1962) : 

Pour 1 litre de solution aqueuse : glucose 5 g ; sucre brun 

commercial 10 g ; tryptone 5 g ; extrait de levure 2,5 g ; 

Versene 36 mg ; eau courante 1000 ml ; pH final a juste a 7,0 

a 7,2 avec KOH. La solution est sterilisee par autoclavage.- 

3 0 pendant 3 0 minutes a 120°C. 

4. R2YE(R5) (Hopwood et al., 1985) : 

Pour 1 litre de solution aqueuse : sucrose 103 g ; K2SO 
_0,25 g 7 MgCl2/6H20 10,12 g' ; casaminoacides 0,1 g ; solution 
de "trace elements" 2 ml ; extrait de levure 5 g ; TES 
35 5,72 g ; bactoagar 15 g ; eau distillee qsp 940 ml. La 

solution est sterilisee par autoclavage pendant 30 minutes a 
120**C. Au moment de I'utilisation, les solutions steriles 
suivantes sont ajoutees : Itf ml de KH^PO^ 0,5 % ; 2 0 ml de 
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CaCl2 IM ; 15 ml de L-proline a 20 % ; 2 0 ml de glucose a 
50 % et 1 ml de CUCI2 lOmM. 

5. 2 X TY : 

Pour 1 litre de solution aqueuse : tryptone 10 g ; extrait de 
5 levure 10 g ; NaCl 5 g. 

6 . Tampon PT : 

Pour 1 litre de solution aqueuse : sucrose 100 g ; K2SO4 
0,25 g ; MgCl2 6H20 5,1 g ; solution de "trace elements" 
2 ml ; eau distillee qsp 875 ml. La solution est sterilisee 
10 par autoclavage pendant 3 0 minutes a 12 0*^0, Au moment de 
I'utilisation, les solutions steriles suivantes sont 
ajoutees : 5 ml de CaCl2 et 2 0 ml de TES 5,3 %. 

7. Sucrose-succinate (Caffrey et al., 1992) : 

Pour 1 litre de solution aqueuse : sucrose 0,2 M ; acide 
15 succinique 20 mM ; phosphate de potassium 20 mM (pH 6,6) ; 
sulfate de magnesium 5 mM ; nitrate de potassium 100 mM ; 
solution de "trace elements" 2 ml. La solution est sterilisee 
par autoclavage pendant 3 0 minutes a 120 °C. 
Les figures ci-annexees illustrent certains aspects de 
20 1' invention. 

La figure 1 represente la voie de biosynthese de 
1' erythromycine A. 

La figure 2 represente la sequence nucleotidique 
(sequence directe et complementaire de SEQ ID N** 1) de la 

2 5 region er-yG-eryAIII du cluster de genes de la biosynthese de 

1' erythromycine comprenant les ORFs 7, 8 et 9 et leurs 
sequences proteiques deduites. 

La figure 3 represente la sequence nucleotidique 
(sequence de SEQ ID N° 6) de la region eryAI-eryK du cluster:;; 

3 0 de genes de la biosynthese de 1 erythromycine comprenant les 

ORFs 13 a 19 et leurs sequences proteiques deduites. 

La figure 4 represente le schema de substitution de gene 
par recombinaison homologue. 

La figure 5A represente 1 ' organisation de la partie 
3 5 gauche du cluster des genes de la biosynthese de I'erythromy- 
cine Chez Sac. erythraea dont les ORFs 1 a 9 sont indiquees 
par des f leches ainsi qu'une carte de restriction des 
plasmides pK62, pBCKl, pKB22\ pBK44, pBIISB, pEco2 et pK23, 
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generes a partir du clone genomique XSE5.5, (Abreviations des 
enzymes de restriction : B, BamHZ ; Be, Bell ; Bg, BglU ; 
-EcoRI ; K, Kpnl ; M, Mlul ; Pstl ; S, Sad ; Sa, Sail.) 
La figure 5B represente 1' organisation de la partie 
5 droite du cluster des genes de la biosynthese de I'erythro- 
mycine chez Sac. erythraea dont les ORFs 13 a 21 sont 
indiquees par des f leches ainsi qu'une carte de restriction 
des plasmides pBK6-12, pCN9, pNC02 8, pNB4 9, pNC062, pPSP4 , 
pNC062X et pBABlS. (Abreviations des enzymes de restriction : 
10 B, BamKZ ; Ba, Ball ; Be, BcII ; C, Cial ; E, EcoRl ; K, 

iCpnl ; N, Ncol ; Ns, Nsil ; P, Pstl ; Pv, PvuXl ; S, Sad ; 
Sc, Seal ; Sh, SphI ; Sp, Spel ; X, Xjbal ; Xh, Xhol) . 

La figure 6A represente le schema de construction du 
plasmide pBIIA. 

15 La figure 6B represente une carte de restriction du 

plasmide pUWL218. 

La figure 6C represente une carte de restriction du 
plasmide pBIlA. 

La figure 7A represente le schema de construction du 
20 plasmide pdel88. 

La figure 7B represente le schema de construction du 
plasmide pdel88A. 

La figure 7C represente le schema de construction du 
plasmide pOBB. 

2 5 La figure 7D represente le schema de construction et une 

carte de restriction du plasmide pCIIIA. 

La figure 8 A represente le schema de construction du 
plasmide pCIlA. 

La figure 8B represente une carte de restriction du --=- 

3 0 plasmide pORTl. 

La figure 8C represente une carte de restriction du 
plasmide pCIIA. 

La figure 9 A represente le schema de construction du 
plasmide pBIVA. 

3 5 La figure 9B represente une carte de restriction du 

plasmide pBIVA. 

La figure lOA represente le schema de construction du 
plasmide pBVA . 
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La figure lOB represente une carte de restriction du 
plasmide pBVA. 

La figure llA represente le schema de construction du 
plasmide pPSTI . 

5 La figure IIB represente une carte de restriction du 

plasmide pPSTI . 

La figure 12A represente le schema de construction du 
plasmide pXhoI. 

La figure 12B represente une carte de restriction du 
10 plasmide pXhoI. 

La figure 13A represente le schema de construction du 
plasmide pCIVA. 

La figure 13B represente une carte de restriction du 
plasmide pCIVA. 

15 La figure 14A represente le schema de construction du 

plasmide pCVA. 

La figure 14B represente une carte de restriction du 
plasmide pCVA. 

La figure 15 represente 1' analyse par Southern blot des 

20 souches mutantes BII92, CIII68, CII62, BIV87, BV88, CIV89 et 
CV90, comparativement a la souche sauvage "red variant" notee 
Wt. Pour chaque mutant, 1' enzyme de restriction utilisee est 
indiquee en-dessous de chaque blot et la taille des bandes 
detectees devant chaque blot est estimee par rapport aux 

25 marqueurs de poids moleculaire X-Hindlll et X-BstEII (non 
detectables par auto-radiographie) . 

La- figure 16 represente 1' analyse par PGR des souches 
mutantes BII91, CIII68, CII62, BIV87, BV88, CIV89 et CV90, 
comparativement a la souche sauvage "red variant" notee Wt^^S^ 

3 0 aux plasmides pBIIA, pCIIlA, pCIlA, pBIVA, pBVA, PCIVA et 
pCVA utilises respect ivement pour obtenir le mutant par 
recombinaison homologue. Les tallies des bandes detectees par 
coloration au bromurie d'ethydium sont estimees par rapport 
aux marqueurs de poids moleculaire $X174-HaeIII ou X-BstEII • 

3 5 La figure 17 represente 1' analyse par CCM des metabo- 

lites produits par les souches mutantes BII92, CIII68, CII62, 
BIV87, BV88, CIV89 et CV90, comparativement aux produits 
standards erythromycine A (Er A) , erythronolide B (EB) et 
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B-a-mycarosyl erythronolide B (MEB) . 

La figure 18 represente 1' analyse par SDS-PAGE de la 
purification de la proteine EryCIII success ivement apres 
extraction a I'uree 7M (ligne 2), chromatographie Q Sepharose 
5 (ligne 3) , chromatographie Superdex (ligne 4) , chromato- 
graphie Q source (ligne 6) avec des marqueurs standard de 
poids moleculaire (lignes 1 et 5) ; 

La figure 19 represente 1' analyse par CMM du test 
d'activite biologique de la proteine EryCIII, par incubation 

10 avec d-TDP-D-desosamine (ligne 2) ou avec d-TDP-D-desosamine 
et 3-a-mycarosyl erythronolide B (MEB) (ligne 3) comparative- 
ment au controle MEB (ligne 1) et au controle erythromycine A 
(ligne 4) • Les pointilles marquent les zones montrant une 
activite antibiotique par autobiogramme sur B. pumilus , 

15 La figure 20 represente la localisation des six cosmides 

(COSAB35, COSAB76, cosAB87, cosAB67 , cosAB63 et cosAB61) 
couvrant 1' ensemble du cluster des genes de la biosynthese de 
I'oleandomycine. Les fragments de restriction BajnHI (note B) 
hybridant avec les sondes notees str M, D, E et les fragments 

20 BamHI (3,5 kb et 2,7 kb) hybridant avec la sonde eryCIIl sont 
montres* 

La figure 21 represente 1 ' organisation de la partie 
droite du cluster des genes de la biosynthese de I'oleandro- 
mycine chez S. antibioticus dont les differentes ORFs (notees 

25 olePl, oleGl, oIeG2, oleM, oleY , oleP et oieB) sont indiquees 
par des f leches ainsi qu'une carte de restriction du plasmide 
pC035-g et I'insert du plasmide pC03 genere a partir du 
pC035-S, La double fleche indique 1' insert correspondant a la 
sequence de la figure 22 (abreviat ions des enzymes de 

3 0 restriction : B, BamHI ; Bg, BglU ; K, Kpnl ; S, Sad ; Sh, 
Sphl ; I'etoile indique qu'il ne s'agit pas d'un site 
unique) • 

La figure 2 2 represente la sequence nucleotidique 
(sequence de SEQ ID N° 15) de la region couvrant les genes 
3 5 olePl, oleGl, oIeG2, oleM et oieY de la biosynthese de 
I'oleandomycine et leurs sequences proteiques deduites. 
EXEMPIiE 1 : clonage et sequengage de la region eryG-eryAIII 
du cluster de genes de la biosynthese de 1' erythromycine. 
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Un fragment d'ADN genomique de Sac. erythraea NRRL 23 3 8 
ay ant. > 2 0 kb en aval du gene ermE couvrant notamment les 
ORFs 3 a 9 et correspondant au clone XSE5.5 ainsi que la 
sequence nucleotidique d'un fragment de 4,5 kb correspondant 
5 a la region du cluster ery comprise entre 3,7 kb et 8,0 kb a 
partir de I'extremite 3' du gene er;nE et comprenant les ORFs 
3, A, 5 et 6 ont ete decrits par Haydock et al. (1991). 

En tenant compte de la carte de restriction montree par 
Haydock et al. (1991) , des sous-clones ont ete derives du 
10 clone XSE5.5 par sous-clonage de fragments de restriction 
dans pUC19. Les plasmides pKB22, pBK44, pBIISB et pEco2 ont 
ete ainsi generes selon la figure 5A de la fatpon suivante : 

A partir de I'ADN du clone XSE5 . 5 digere par 1' enzyme de 
restriction KpnT , les plasmides pK62 et pK66 ont ete 
15 directement construits par sous-clonage du fragment Kpnl de 
5,8 kb dans pUC19 , le plasmide pK66 correspondant au meme 
fragment Kpnl sous-clone avec une orientation inversee de 
1' insert par rapport au vecteur. Le plasmide pKB2 2 contenant 
un insert de 2 , 9 kb a ete ensuite derive du plasmide pK66 par 
2 0 excision du fragment BajnHI-Bglll (2,9 kb) couvrant I'ORFS 
ainsi qu'une partie des ORFs 7 et 9 par digestion avec les 
enzymes de restriction BamKl et Bgl II. De la meme fa<?on, le 
plasmide pKB44 contenant un insert de 2 , 9 kb a ete obtenu a 
partir du plasmide pK62 par excision du fragment BamHI-Bglll 
25 (2,9 kb) couvrant le gene eryG correspondant aux ORFs 5 et 6 
et le gene eryF correspondant a 1'0RF4. 

Le^ plasmide pBIISB a ete derive du plasmide pBK44 par 
sous-clonage dans pUC19 du fragment Sail de 600 pb obtenu a 

partir du plasmide pBK44 digere par 1' enzyme de restriction^ 

30 Sail (figure 5A) . 

A partir de I'ADN du clone XSE5.5 digere par I'enzyme de 
restriction Eco'RZ , le plasmide pEco2 a ete directement 
construit par sous-clonage du fragment £coRI (2,2 kb) dans 
pUC19 . 

35 Les sous-clones pKB22, pBK44, pBIISB et pEco2 ainsi 

obtenus ont ete ensuite sequences. L' analyse a ete faite sur 
des echantillons d'ADN plasmidique, prealablement purifie sur 
une colonne de Quiagen 100 (Quiagen) , sur le sequenceur 
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automatique ABI prism 377 • Les reactions de sequen^age ont 
ete realisees par la methode de Sanger (1977) en utilisant 
les amorces M13 conventionnelles ou des amorces synthetiques 
et des didesoxynucleosides triphosphate fluorescents et la 
5 polymerase Taq FS (Perkin Elmer) en presence de 5 % de 

dimethylsulf oxide, les amorces synthetiques utilisees ayant 
les sequences suivantes : 
C3R2 TCCTCGATGGAGACCTGCC 
B2R1 GAGACCATGCCCAGGGAGT 

10 C3S2 TCTGGGAGCCGCTCACCTT 
C2R1 GACGAGGCCGAAGAGGTGG 
C2 S GCACACCGGAATGGATGCG 
f ul 1C3 S CCGTCGAGCTCTGAGGTAA 
fullC3R GCCCGAGCCGCACGTGCGT 

15 C4 TGCACGCGCTGCTGCCGACC 

L' assemblage des donnees de sequence a ete realise avec 
le logiciel Autoassembler™ pakage (Applied Biosystem) . Les 
sequences ont ete analysees en utilisant 1' ensemble des 
logiciels GCG (Devereux 1984) . 

20 Les sequences nucleotidiques obtenues ont permis 

d'etablir la sequence nucleotidique de 3412 bp de la figure 2 
(sequence directe et complementaire de SEQ ID N** 1) dans 
laquelle trois ORFs (7, 8 et 9) ont ete identifiees respect i- 
vement du nucleotide 8957 au nucleotide 7959, du nucleotide 

25 10219 au nucleotide 8957 et du nucleotide 11315 au nucleotide 
10233 (numerotes dans la figure 2 a partir du site BajnHI 
situe a I'extremite 5' du gene erjnE) (respectivement sequence 
complementaire de SEQ ID N*" 1 du nucleotide 4 8 au nucleotide 
1046, du nucleotide 1046 au nucleotide 2308 et du nucleotide — 

30 2322 au nucleotide 3404) et correspondant respectivement aux 
genes eryBII, eryCIII et eryCII selon Liu et Thorson (1994) 
dont les caracterisations f onctionnelles n'avaient pas encore 
ete identifiees. Les trois ORFs 7, 8 et 9 ont la meme 
orientation, la lecture se faisant a partir de la region 3' 

3 5 du gene eryAIII. 

Des echantillons de E, coli XLl-blue contenant la region 
codante des ORFs ci-dessus ont ete deposes a la Collection 
Nationale de Cultures de Micrborganismes (CNCM) INSTITUT 



(SEQ ID N*' 22) 

(SEQ ID 23) 

(SEQ ID NO 24) 

(SEQ ID N<=* 25) 

(SEQ ID N° 26) 

(SEQ ID N** 27) 

(SEQ ID N° 28) et 

(SEQ ID N° 29) . 
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PASTEUR, 25, Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, 
le 16 juillet 1997 : 

- le plasmide pK62 comprenant la sequence codante pour 
l'ORF7, I'ORFS et une partie de l'ORF9 sous le numero 1-18 97, 
5 - le plasmide p^:co2 comprenant la sequence codante pour 
l'ORF9 et une partie de I'ORFS sous le numero 1-1899. 
EXEMPLE 2 : construction du plasmide pBIlA. 

Un plasmide d' integration, denomme pBIlA et portant une 
deletion dans le gene eryBII codant pour l'ORF7, a ete 

10 construit selon le schema de la figure 6A. 

Le fragment BcII-BajnHI de 59 8 pb a ete delete dans le 
plasmide pK62 obtenu a I'exemple 1 par digestion avec les 
enzymes BcII et BamHI, Le plasmide pBCKl resultant a ete 
ensuite digere avec les enzymes de restriction Mlul et Bglll 

15 de faqion a deleter un fragment ayant 8 53 pb a I'interieur de 
l'ORF7 du nucleotide 8011 au nucleotide 8863 de la sequence 
de la figure 2. Apres remplissage des extremites a I'aide du 
fragment de Klenow de I'ADN polymerase I, le plasmide 
contenant la deletion , a ete religature et transforme dans 

20 JE:. coll XLl-blue. A partir du plasmide pl9BIlA ainsi genere, 
le fragment iCpnI-Hindlll (4,3 kb) qui porte la deletion a ete 
sous-clone dans le plasmide pUWL218 (figure 6B) . La presence 
de la deletion de 853 pb du nucleotide 8011 au nucleotide 
8863 dans le plasmide pBIlA ainsi genere (figure 6C) a ete 

2 5 confirmee par sequen9age, 

Le plasmide pBIlA a ensuite ete transfere dans la souche 
E. coli. . DHSaMRC, puis utilise pour transformer Sac. 
BrythjraBa . 

EXEMPLE 3 : construction d'une souche Sac. Gjryrtturaea. Gry BTXAr 
30 (BII92) , 

La construction d'une souche Sac. erythraea dans 
laquelle le gene eryBII porte une deletion interne telle que 
celle introduite dans le plasmide pBIlA prepare a I'exemple 2 
et le processus d' integration ont ete realises de la fagon 

3 5 suivante : 

La preparation des protoplastes a ete realisee selon la 
methode decrite par Weber et Losick (1988), en utilisant du 
PEG 3350 (Sigma) au lieu de PEG 1000 et un tampon P modifie 
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(denomme PT) contenant MgCl2,6H20 28 mM et sans PO4H2K au 
lieu des tampons P, L ou T decrits, selon les conditions 
operatoires suivantes : 

Les cellules (au moins 10® spores) de Sac. erythraea "red 
5 variant" (dont un echantillon a ete depose a la Collection 
Nationale de Cultures de Microorganismes (CNCM) INSTITUT 
PASTEUR, 25, Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, 
le 16 juillet 1997 sous le numero 1-1902) ont ete mises a 
pousser dans 50 ml de milieu TBS pendant 3 a 5 jours a 30°C, 

10 puis lavees dans du sucrose a 10,3 %♦ Les cellules ont ete 
remises en suspension dans 50 ml de tampon PT contenant 2 a 
5 mg/ml de lysozyme (Sigma) , puis incubees a 30 °C pendant 1 a 
2 heures en desagregeant les amas de mycelium toutes les 15 
minutes jusqu'a conversion d'au moins 50 % du mycelium en 

15 protoplastes . Les protoplastes ont ete laves avec 50 ml de 
tampon PT, remis en suspension dans 12,5 a 25 ml du meme 
tampon, congeles lentement puis stockes a -80 ®C par aliquots 
de 200 (xl. 

Pour la transformation, un aliquot a ete decongele et 

20 50 fil ont ete preleves puis transferes dans un tube de 15 ml. 
Un a 10 Mg d'ADN plasmidique pBIIA, prepare a I'exemple 2 a 
partir de la souche E, coli DH5aMRC ont ete mis en solution 
dans 5 a 10 Ml tampon TE (Tris HCl 10 mM pH 7,5, EDTA 
1 mM) puis deposes sur la paroi du tube incline auquel a ete 

25 ensuite ajoute 0,5 ml d'une solution de PEG 3350 dans le 
tampon PT preparee extemporanement a partir d'une solution 
aqueuse a 50 % que I'on dilue au demi dans le tampon 2 x PT. 
Apres dilution avec 3 a 5 ml de tampon PT puis centrif ugation 
a 2500 rpm pendant 15 mn, le culot a ete dissocie dans 0^5=-ml' 

3 0 de tampon PT et la suspension de protoplastes transformes 

ainsi obtenue a ete immediatement repartie sur 2 ou 3 boltes 
R2T2 tres seches (3 h sous une hotte a flux laminaire) . Les 
boltes ont ete ensuite incubees a 3 2°C pendant 16 a 24 h 
jusqu'a apparition du voile de regeneration des' protoplastes. 

35 A partir d'une solution stock de thiostrepton (Sigma) a 

50 mg/ml dans le DMSO, une quant ite appropriee a ete diluee 
dans 0,5 a 1 ml d'eau puis etalee sur les boltes de faqron a 
obtenir une concentration finale de 2 0 /zg de thiostrepton/ml 
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de gelose. Apres absorption complete de I'antibiotique, les 
boites ont ete incubees a 3 2*^C pendant 3 a 4 jours, ce qui 
permet la visualisation des transf ormants . Les boites ont 
encore ete incubees plusieurs jours jusqu'a developpement 
5 complet des spores. 

La selection des integrants correspondant au premier 
evenement de recombinaison (figure 4) a ete realisee par 
replication des boites sporulees a I'aide de velours ou par 
etalement d'une suspension des spores sur des boites R2T2 
10 contenant du thiostrepton puis incubation a 3 2*=*C, ce qui 
permet la croissance des clones d' integrants potentiels. 

Pour la selection de clones ayant subi un deuxieme 
evenement de recombinaison (figure 4) , 5 a 10 clones 
resistants au thiostrepton obtenus ci-dessus ont ete mis en 
15 culture dans 8 ml de milieu liquide TSB a 30°C pendant 3 a 4 
jours. 50 a 100 /xl ont ete preleves et remis en culture dans 
les memes conditions. Apres 4 cycles successifs de dilution 
et culture destines a favoriser la perte du marqueur de 
resistance au thiostrepton, des protoplastes ont ete 
20 preparees a partir des cellules comme indique ci-dessus, de 
fa9on a chasser le plasmide. Les protoplastes ont ensuite ete 
etales sur des boites R2T2 de fagon a obtenir des colonies 
individualisees dont la sensibilite au thiostrepton a ete 
determinee par replique sur des boites R2T2 contenant du 
2 5 thiostrepton. 

Selon la position du deuxieme evenement de recombinaison 
par rapport au site de deletion (figure 4) , on peut attendre 
que le phenotype des colonies sensibles au thiostrepton soit 
du type sauvage ou du type mute porteur de la deletion. ';;^IZS 
30 Parmi les colonies sensibles au thiostrepton, la 

selection des mutants ayant le phenotype ery" a ete realisee 
par antibiogramme sur la souche B. pumllus ATCC 14884 
sensible a 1 ' erythromycine . La souche B. pumilus a ete 
utilisee comme souche indicatrice pour evaluer la production 
35 d' erythromycine dans des essais biologiques ^par anti- 
biogramme. Les colonies ont ete etalees a I'anse de platine 
sur des boites R2T2 , puis incubees pendant 3 a 4 jours a 
3 0**C. Des zones d'agar ou le" mutant a pousse a confluence ont 
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ensuite ete prelevees a I'emporte piece puis placees sur des 
boites A-Merck recouvertes d^une surcouche de 4 ml de 0,5 x A 
Merck (Antibiotic agar N°l Merck) inoculee d'une suspension 
de spores de B. pumllus , puis incubees une huit a 37**C. 
5 La presence de la deletion attendue dans le chromosome 

du mutant (deletion de 853 pb du nucleotide 8011 au nucleo- 
tide 88 63 de la figure 2) a ensuite ete confirmee par analyse 
genomique par Southern blot ainsi que par PGR de la fagon 
suivante : 

10 Pour 1' analyse par Southern blot, le transfert d'ADN 

genomique, prealablement digere avec 1' enzyme de restriction 
appropriee, sur des membranes GeenscreenPlus (Dupont NEN) a 
ete realise dans NaOH 0,4 M selon Ausubel et al. (1995). Les 
hybridations ont ete effectuees en utilisant comme sonde 

15 1 ' oligonucleotide marque a son extremite 5' en utilisant du 
[Y"^^P]ATP (Amersham) et la polynucleotide kinase (Boehringer 
Mannheim) selon Sambroock et al. (1989), ayant la sequence 
suivante : 

B2-S TTGGCGAAGTCGACCAGGTC (SEQ ID N° 3 0) 

20 correspondant a la region d'ADN du debut du gene eryG situee 
de la position 4118 a la position 4137 de la sequence deposee 
dans la base EMBL sous la reference X60379 et decrite par 
Haydock et al. (1991). Les hybridations ont ete effectuees 
avec un tampon d' hybridation rapide (Amersham) et les 
25 conditions de lavage suivantes : 2 x 5 mn, 2 x SSC, 20*'C ; 
30 mn, 2 x SSC, 65°C ; 30 mn, 0,1 x SSC, 20°C. 

Par hybridation Southern sur I'ADN genomique isole selon 
Hopwood et al. (198 5) puis digere par 1' enzyme de restriction 
Kpnl, une bande de 5 , 8 kb a partir de la souche sauvage "-red— 
30 variant" et une bande de 4 , 9 kb a partir du mutant BII92 ont 
ete detectees. Les resultats montres a la figure 15 indiquent 
la presence chez le mutant d'une deletion d'environ 900 pb 
dans cette region du chromosome. 

Pour I'analyse par PGR ,un echantillon de 100 ^1 d'une 
35 culture de 3 jours en milieu TSB a ete centrifuge. Le culot 
obtenu a ete remis en suspension dans 10 /xT de milieu TSB, 
puis utilise pour 1' amplification dans I'appareil genAmp PGR 
system 9600 (Perkin Elmer Cetus) . Apres chauf fage de 



wo 99/05283 



PCT/FR98/01593 



29 

I'echantillon pendant 3 mn a .94^C, les conditions 
d' amplification suivantes ont ete utilisees : 94 1 mn ; 
55*»C, 1 mn ; 72<>C, 3 mn ; 3 0 cycles ; polymerase Ampli Tag 
(Perkin Elmer) en presence de dimethylsuf oxyde 10 % (v/v) 
5 suivis d'une elongation de 3 mn a 72 °C . L' amplification a 
ete effectuee en utilisant 1 ' oligonucleotide B2S ci-dessus et 
1' oligonucleotide ayant la seguence suivante 
B2-R GCCGCTCGGCACGGTGAACTTCA (SEQ ID N*^ 31) 

correspondant a la seguence du brin complementaire de la 
10 region d'ADN situee de la position 8873 a la position 8892 de 
la seguence de la figure 2 a laguelle ont ete ajoutes trois 
nucleotides a I'extremite 5' et permettant d'encadrer par 
amplification PGR la region portant la deletion interne a 
1 ' ORF7 . 

15 L' analyse par amplification par PGR sur des cellules 

entieres a permis de detecter une bande d' environ 1 3cb dans 
la souche sauvage et une bande de 0,16 kb dans le mutant 
BII92 de fa<?on identique au signal obtenu avec le plasmide 
pBIlA. Les resultats montres a la figure 16 confirment que la 

2 0 deletion d' environ 9 00 pb detectee par 1' analyse Southern est 

identigue a celle portee par le plasmide pBIlA (853 pb) • 

La souche recombinante ainsi obtenue, designee BII92, a 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche. 

25 EXEMPLE 4 : fermentation de la souche BII92 et identification 
des metabolites secondaires produits. 

Des extraits de bouillon de culture de la souche ont ete 
analyses par chromatographie en couche mince (ccm) avec 
I'erythromycine A, 1 ' erythronolide B et le 3-a-mycarosyl 

3 0 erythronolide B comme standards. 

La souche BII92 a ete cultivee en erlen de 50 ml dans 
les conditions permettant une production optimale 
d' erythromycine A et de ses derives gui consistent a 
effectuer une preculture cellulaire a 28 °G pendant 48 heures 
35 dans le milieu EPl (Solulys L-Corn steep liguor (Roguette 
freres) 5 g/1 ; farine de soja deshuilee (Gargill) 10 g/1 ; 
G03Ca 2 g/1 ; GlNa 5 g/1 ; pH = 6 , 8 ; glucose qsp 15 g/1 
ajoute apres autoclavage) , puis une culture pendant 72 heures 
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apres dilution a 7 % v/v avec le milieu EP2 (farine de soja 
deshuilee 10 g/1 ; CO^Ca 0,2 g/1 ; CI2C0-6H2O 1 irig/l ; pH = 
6,8-7,0 ; glucose qsp 20 g/1 ajoute apres autoclavage) . 

Le surnageant de culture a ete ensuite extrait a pH 9-10 
5 avec de 1' acetate d'ethyle. Les phases organiques ont ete 
sechees sur SO^Mg, amenees a sec sous pression reduite puis 
analysees par cciti sur gel de silice 60 F254 (Merck) 
[dichlorome thane /methanol (90:10, v/v) ou ether 
isopropylique/methanol/NH^OH a 25 % (75:35:2, v/v)]. De fa^on 

10 alternative, 1' analyse a ete realisee par ccm sur des plaques 
de gel de silice greffees de type NH2 F254 (Merk) [chlorure 
de butyle/methanol (90:10, v/v)]. 

La revelation chimique des plaques a ete effectuee par 
pulverisation d'une solution de p-anisaldehyde-acide 

15 sulfurique 98 %-ethanol (1:1:9, v/v), suivie de chauffage 

pendant quelques minutes a 80°C, Les activites antibiotiques 
potentielles ont ete analysees par bioautographie directe des 
plaques de ccm sur agar ensemence de B. pumilus ATCC 14884. 
Les resultats obtenus par revelation chimique (figure 

20 17) montrent que la souche BII92 accumule pref erentiellement 
1 ' erythronolide B comme attendu d'un mutant er-yB. 

Des metabolites mineurs de faible mobilite manifestant 
une activite antibiotique ont egalement ete detectes . Ces 
metabolites ont ete extraits a I'acetate d'ethyle et 

25 identifies par chromatographie liquide a haute performance en 
phase inverse (RP-HPLC) couplee a la spectrometrie de masse. 
La RP-HPLC a ete effectuee sur colonne (250 x 4,6mm) de 
Kromasil CIS 5fJL en utilisant comme phase mobile le melange 
acetonitrile/methanol/acetate d' ammonium 0,065 M pH 6,7 - — 

30 (350:150:500, v/v) sur un chromatographe Waters equipe d'un 
spectrometre de masse Finningan TSQ 7000, 

A cote de traces d' erythromycine A, B, C et D, 4 
metabolites mineurs denommes Ml a M4 ont ete detectes : 
- Ml donne un pic parent a m/z 704 et des produits de 

35 fragmentation a m/z 576 et m/z 158. La presence de desaminyl- 
erythronolide A (m/z 576) indique que la difference de m/z de 
30 comparee a 1 ' ^rythromycine A (m/z 734) ou de 16 comparee a 
1' erythromycine C (m/z 72 0) est portee par le residu sucre 
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neutre. La structure proposee pour Ml est la 3"-C desmethyl- 
2" , 3"-ene-erythromycine C. 

- M2 donne un pic parent a m/z 706 et des produits de 
fragmentation a m/z 576 et m/z 158. La presence de desaminyl- 

5 erythronolide A (m/z 576) indique que la difference de m/z de 
2 8 comparee a 1 ' erythroraycine A (m/z 7 34) ou de 14 comparee a 
I'erythromycine C (m/z 72 0) est portee par le residu sucre 
neutre. La structure proposee pour M2 est la 3"-C desmethyl- 
erythromycine C, 

10 - M3 donne un pic parent a m/z 690 et des produits de 

fragmentation a m/z 560 et m/z 158. La presence de desaminyl- 
erythronolide B (m/z 560) indique que la difference de m/z de 
28 comparee a 1 ' erythromycine B (m/z 718) ou de 14 comparee a 
1 ' erythromycine D (m/z 704) est portee par le residu sucre 

15 neutre. La structure proposee pour M3 est la 3"-C desmethyl- 
ery thr omy c ine D . 

- M4 donne un pic parent a m/z 720 et des produits de 
fragmentation a m/z 576 et m/z 158. Le profil est identique a 
celui de 1 ' erythromycine C (m/z 72 0) avec la presence de 

20 desosaminylerythronolide A (m/z 576) et la perte du residu 
sucre amine (m/z 158), mais le metabolite M4 n'a pas le meme 
temps de retention en RP-HPLC que 1 ' erythromycine . La 
structure proposee pour M4 est la 3"-C desmethyl- 
erythromycine A- 

25 La detection par SM-SM du metabolite mineur Ml ayant un 
sucre neutre insature (3"-C desmethyl-2 " , 3 "-ene-erythromycine 
C) indique que le gene eryBII code pour la dTDP-4-ceto-L-6- 
desoxyhexose 2 , 3-reductase dans la voie de biosynthese du 
dTDP-mycarose . 

3 0 La souche BII92 a ete deposee a la Collection Nationale de 
Cultures de Microorganismes (CNCM) INSTITUT PASTEUR, 25, Rue 
du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, le 16 juillet 
1997 sous le numero 1-1903 . 

EXEMPLE 5 : construction du plasmide pCIIlA. 
3 5 L'ORFS pouvant etre traductionnellement couplee a l'ORF7 

situee en aval, une deletion en phase a ete introduite de 
fagon a eviter un effet polaire, Un plasmide d' integration, 
denomme pCIIIA porteur d'une telle deletion, a ete construit 
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selon le schema de la figure 7(A-D). 

Une deletion Sail de 663 pb a ete introduite dans I'ORFS 
du nucleotide 93 84 au nucleotide 1004 6 de la sequence de la 
figure 2 en sous-clonant dans le plasmide pUC19 les deux 
5 fragments Sail (a : 794 pb et b : 631 pb montres a la figure 
5A ) isoles a partir du plasmide pBK4 4 obtenu a I'exemple 1 
pour generer le plasmide pdelBB (figure 7A) . La presence de 
la deletion de 6 63 pb a ete confirmee par sequengage. Le 
plasmide pdel88 a ete ensuite soumis a deux sous-clonages 
10 additionnels de fa^on a elargir les regions chromosomiques- 
utilisables pour la recombinaison homologue des deux cotes du 
site de deletion^ Le fragment Sad (450 pb) du plasmide 
pdel88 a d'abord ete remplace par le fragment Sad (1,1 kb) 
du plasmide pEco2 obtenu a I'exemple 1 pour generer le 
15 plasmide pdel88A (figure 7B) . Puis le fragment -EcoRI (1,5 kb) 
portant la deletion dans I'ORFS a ete isole du plasmide 
pdel88A et utilise pour remplacer le fragment EcoRl (1,66 kb) 
porteur de I'ORF intacte dans le plasmide pOBB. Le plasmide 
pOBB, represente a la figure 7C, correspond au plasmide pBK4 4 
2 0 prepare a I'exemple 1 dans le site PstI duquel a ete sous- 
clone le fragment PstI de 4 kb du plasmide pIJ48 6 obtenu par 
digestion par 1' enzyme de restriction PstI et porteur de 
I'origine de replication streptomyces ainsi que du gene de 
resistance au thiostrepton . Le plasmide resultant pCIIIA 
25 porte des regions chromosomiques pour la recombinaison 

homologue de 1,27 kb et 1,38 kb respectivement en amont et en 
aval du site de deletion, Le plasmide pCIIlA ainsi obtenu 
(figure 7D) a ensuite ete transfere dans la souche E. coll 
DH5aMRC, puis utilise pour transformer Sac. Brythraea. '-^ZTT 
3 0 EXEMPLE 6 : construction d'une souche Sac. GirytturaBa eryCIIIA 
(CIII68) . 

Une souche dans laquelle le gene eryCIII porte une 
deletion interne telle que celle introduite dans le plasmide 
pCIIlA obtenu a I'exemple 5 a ete preparee par transformation 
3 5 des protoplastes de Sac. erythraBa avec le plasmide pCIIlA. 
La preparation des protoplastes, le processus 
d' integration et la selection des mutants ayant le phenotype 
ery" ont ete realises comme a I'exemple 3. 
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De plus, la presence de la deletion attendue dans le 
chromosome (deletion de 663 pb du nucleotide 9384 au 
nucleotide 1004 6 de la sequence de la figure 2) a ete 
confirmee par analyse genomique par Southern blot ainsi que 
5 par amplification par PGR selon les conditions decrites a 
I'exemple 3 . 

Par hybridation Southern sur I'ADN genomique digere par 
1' enzyme de restriction -E^coRI, en utilisant comme sonde 
1' oligonucleotide ayant la sequence suivante 

10 C3-S ATGCGCGTCGTCTTCTCCTCCATG (SEQ ID N*' 32) 

correspondant au brin complementaire de la region d'ADN 
situee de la position 10196 a la position 10219 de la 
sequence de la figure 2, une bande de 2 , 2 kb a partir de la 
souche sauvage et une bande de 1 , 5 kb a partir du mutant 

15 CIII68 ont ete detectees. Les resultats montres a la figure 
15 indiquent la presence chez le mutant d'une deletion 
d' environ 7 00 pb dans cette region du chromosome. 

L' amplification par PGR a ete effectuee en utilisant 
1' oligonucleotide C3-S ci-dessus et 1 ' oligonucleotide ayant 

2 0 la sequence suivante 

C3-R TGATGGTGGTTGTCTCCTTCG (SEQ ID N** 33) 

correspondant a la sequence situee de la position 8954 a la 
position 8974 de la sequence de la figure 2 permettant 
d'encadrer par amplification PGR la region portant la 

25 deletion interne a I'ORFS. L' analyse par amplification par 
PGR a permis de detecter une bande d' environ 1,2 kb dans la 
souche isauvage et une bande d' environ 0,6 kb dans le mutant 
CIII68 de fatjon identique au signal obtenu avec pGIIlA. Les 
resultats montres a la figure 16 confirment que la deletion 

30 d'environ 700 pb detectee par I'analyse de Southern est 
identique a celle portee par le plasmide pCIIIA (663 pb) . 

La souche recombinante ainsi obtenue, designee GIII68, a 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche • 

35 EXEMPLE 7 : fermentation de la souche CIIX68 et identifi- 
cation des metabolites secondaires produits. 

La culture de la souche GIII68 et les analyses par ccm 
suivie de bioautographie ont ete realisees selon les 
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conditions indiquees a I'exemple 4, 

Les resultats de ccm (figure 17) montrent que la souche 
CII68 accximule pref erentiellement du 3-a-mycarosyl erythro- 
nolide B ainsi que de petites quantites d' erythronolide B 
5 coinine attendu d'un mutant eryC. 

La sequence eryCIII presehte une forte hoxnologie avec 
d'autres glycosyltransf erases putatives telles que DauH (43 % 
d'identite au niveau proteique) et DnrS (47 % d'identite) 
impliquees dans la biosynthese de la daunorubicine chez 

10 S. peucBtius (Otten et al., 1995) et chez Streptomyces sp C5 
(Dickens et al., 1996) ainsi que TylM2 (50 % d'identite) 
impliquee dans le transfert du mycaminose sur la tylactone 
dans la voie de biosynthese de la tylosine chez S, fradiae 
(Gandecha et al., 1997). 

15 Ces observations indiquent que gene eryCIII code pour la 

desosaminyltransf erase dans la voie de biosynthese de 
1 ' erythromycine . 

EXEMPLE 8 : construction du plasmide pCIIA . 

Un plasmide d ' integration , denomme pCIIA et portant une 
20 deletion dans le gene eryBII codant pour l'ORF9, a ete 
construit selon le schema de la figure 8A. 

Le plasmide pK2 3 (figure 5A) a ete obtenu par sous- 
clonage dans pUC19 du fragment Kpnl de 10 kb isole a partir 
de I'ADN du clone XSE5 . 5 digere par 1' enzyme de restriction 
25 Kpnl. 

Dans un premier temps, le vecteur navette pORTl, montre 
a la figure 8B, a ete obtenu par sous-clonage du fragment 
PstI de 4kb isole par digestion du plasmide pIJ486 avec 

1' enzyme de restriction PstX incluant le gene de resistance? 

30 au thiostrepton et le replicon Streptomyces, dans le site 
PstI de pUC19. 

Une deletion hors phase de 3 04 pb a ete introduite dans 
l'ORF9 du nucleotide 10881 au nucleotide 11184 de la sequence 
de la figure 2 en sous-clonant le fragment Sacl-Xpnl (1,1 kb) 
3 5 du plasmide pK2 3 avec le fragment EcoRl-Kpnl (1,7 kb) du 
plasmide pEco2 obtenu a I'exemple 1 dans le* plasmide pORTl 
ci-dessus prealablement digere avec les enzymes de restric- 
tion Sad et £:coRI* Le plasmide d' integration pCIIA a;:-ns i 
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obtenu (figure 8C) a ete ensuite transfere dans la souche E. 
coli DHSaMRC, puis utilise pour transformer Sac, erythraest. 
EXEMPLE 9 : construction d'une souche Sac. ejrythjraea eryCIlA 
{CII62) . 

5 Une souche dans laquelle le gene eryCII porte une 

deletion interne telle que celle introduite dans le plasmide 
pCIlA obtenu a I'exemple 8 a ete preparee par transformation 
des protoplastes de Sac, erythraea avec le plasmide pCIlA. 
La preparation des protoplastes, le processus d'inte- 

10 gration et la selection des mutants ayant le phenotype ery" 
ont ete realises comme a I'exemple 3. 

De plus, la presence de la deletion attendue dans le 
chromosome (deletion de 304 bp du nucleotide 10881 au 
nucleotide 11184 de la sequence de la figure 2) a ete 

15 confirmee par analyse genomique par Southern blot ainsi que 
par PGR selon les conditions decrites a I'exemple 3. 

Par hybridation Southern sur I'ADN genomique digere par 
1' enzyme de restriction EcoRl , en utilisant comme sonde 
1 ' oligonucleotide C3-S ayant la sequence ci-dessus, une bande 

2 0 de 2,2 kb a partir de la souche sauvage et une bande de 1,8 
kb a partir du mutant CII62 ont ete detectees. Les resultats 
montres a la figure 15 indiquent chez le mutant la presence 
d'une deletion d'environ 400 pb dans cette region du 
chromosome . 

25 L'amplif ication par PGR a ete effectuee en utilisant 

1' oligonucleotide ayant la sequence suivante 
C2-S 'GGAATTCATGACCACGACCGATC (SEQ ID N*=' 34) 

correspondant au brin complementaire de la region d'ADN de la 
fin du gene eryAIII situee de la position 20258 a la posit Ton' 

30 20280 de la sequence deposee dans la base EMBL sous la 
reference X62569 et decrite par Bevitt et al., 1992 et 
1' oligonucleotide ayant la sequence suivante 
C2-R CGCTCCAGGTGCAATGCCGGGTGCAGGC (SEQ ID N** 3 5) 

correspondant a la sequence situee de la position 10558 a la 

35 position 10585 de la sequence de la figure 2 permettant 
d'encadrer par amplification PGR la region portant la 
deletion interne a 1'0RF9. L'analyse par amplification par 
PGR a permis de detecter une bande d' environ 7 60 pb dans la 



wo 99/05283 



PCT/FR98/01593 



36 

souche sauvage et une bande environ 4 60 pb dans le mutant 
CII62 de faqron identique au signal obtenu avec pCIlA. Les 
resultats montres a la figure 16 confirment que la deletion 
d' environ 4 00 pb detectee par 1' analyse Southern est 
5 identique a celle portee par le plasmide pCIIA (3 04 pb) • 

La souche recombinante ainsi obtenue, designee CII62, a 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche, 

EXEMPLE 10 : fermentation de la souche CXX62 et identifi- 
10 cation des metabolites secondaires produits. 

La culture de la souche CII62 et les analyses par com 
suivie de bioautographie ont ete realisees selon les 
conditions indiquees a I'exemple 4. 

Les resultats de ccm (figure 17) montrent que la souche 
15 CII62 accumule pref erentiellement du 3-a-mycarosyl erythro- 
nolide B ainsi que de petites quantites d ' erythronolide B 
comme attendu d'un mutant eryC. 

La sequence eryClI presente une forte homologie avec des 
genes impliques dans les voies de biosynthese de la dauno- 
20 samine (DnrQ, 38 % d'identite au niveau proteique, Otten et 
al., 1995) et du mycaminose (proteine codee par I'ORFl*, 40 % 
d'identite au niveau proteique, Gandecha et al., 1997) qui 
ont egalement besoin de transferer un groupement ceto en 
position 3 a partir d'un carbone adjacent, 

2 5 Ces observations indiquent que le gene eryCII code pour 

la dTDP-4-cetO"D-6-desoxyhexose 3 , 4-isoinerase dans la voie de 
biosynthese de la dTDP-desosamine . 

EXEMPLE 11 : clonage et sequengage de la region eryAI-eryK du 
cluster de genes de la biosynthese de I'erythromycine, —-^ — ; 

3 0 Des cosmides contenant la region eryAI-eryK du cluster 

de genes ery tel que le cosmide Cos6B, ont ete isoles par 
screening d'une banque d'ADN genomique de Sac. erythr^ea dans 
le vecteur cosmidique pWE15 (Stratagene) en utilisant comme 
sonde un fragment d'ADN de 13,2 kb comprenant la totalite du 
3 5 gene eryAI et correspondant a la region d'ADN comprise entre 
le site Wcol situe a la position 44382 de la sequence de la 
figure 3 et le site Ncol situe a la position 392 de la 
sequence X62569 (Bevitt et al., 1992). La sonde a ete 
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prepares de la fa9on suivante : Dans un premier temps, le 
fragment Ncol de 13,2 kb a ete isole a partir du plasmide 
pBK25 decrit par Bevitt et al., 1992 et sous-clone dans le 
site Smsil de pUClS apres remplissage des extremites NcoX avec 
5 le fragment de Klenow. A partir du plasmide pNC012 ainsi 

genere, le fragment de 13,2 kb a ete isole par digestion avec 
1' enzyme de restriction Wcol. 

Le cosmide cos6B ainsi obtenu a ete digere par 1' enzyme 
de restriction Ncol et les fragments resultants de 2,8 kb et 
10 6,1 kb ont ete clones dans le site Ncol du vecteur Litmus28 
generant respect ivement les plasmides pNC02 8 et pNC062 
montres a la figure 5B. 

Le plasmide pNC028 a ete sequence par generation de 
sous-clones en utilisant 1 ' exonuclease III selon le protocole 
15 du fournisseur de la trousse Erase-a-Base Kit (Promega) en 
digerant par les enzymes de restriction respectivement 
Sacl/Xbal et Nsil/BamHl pour la direction inverse. La 
sequence a ete completee en utilisant comme amorces les 
oligonucleotides synthetiques ayant les sequences suivantes 
20 644 GATCACGCTCTTCGAGCGGCAG (SEQ ID N*» 3 6) 

64 5 GAACTCGGTGGAGTCGATGTC (SEQ ID N*^ 37) et 

650 GTTGTCGATCAAGACCCGCAC (SEQ ID N° 38) 

Pour le sequengage du plasmide pNC062, des matrices ont 
ete generees par sonication de I'ADN selon Bankier et al. 
25 (1987) en utilisant pUC18 comme vecteur. La sequence a ete 
completee en utilisant comme amorces les oligonucleotides 
synthetiques ayant les sequences suivantes :. 
64 6 CATCGTCAAGGAGTTCGACGGT (SEQ ID N« 39) 

647 TGCGCAGGTCCATGTTCACCACGTT (SEQ ID 40) -"'J ~ 

3 0 64 8 GCTACGCCCTGGAGAGCCTG (SEQ ID N*> 41) 

649 GTCGCGGTCGGAGAGCACGAC (SEQ ID N** 42) et 

874 GCCAGCTCGGCGACGTCCATC (SEQ ID N° 43). 

Les jonctions Ncol ont ete sequencees en utilisant comme 
matrice I'ADN du cosmide cos6B obtenu ci-dessus dont les 
3 5 regions recouvrant les sites Ncol ont ete sequencees en 
utilisant les amorces ayant les sequences 644 et 645 
indiquees ci-dessus . 

De plus, un fragment Clal-Ncol de 0,9 kb, contenant le 
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debut de la sequence du gene eryAI et la partie 5' de 
I'ORFIS, a ete clone dans pUClB. Ce fragment a ete prepare de 
la fa9on suivante : Le plasmide pBK6-12 represents a la 
figure 5B a d'abord ete genere par sous-clonage dans le 
5 phagmide pTZlBR du fragment Kpnl de 4,5 kb isole a partir du 
plasmide pBK25 decrit par Bevitt et al., 1992. Le sous-clone 
pCN9 a ensuite ete genere par sous-clonage du fragment Clal- 
Ncol de 0,9 kb isole a partir du plasmide pBK6-12 dans le 
site Sjnal de pUC19, apres remplissage des extremites a I'aide 

10 du fragment de Klenow. Le plasmide pCN9 ainsi obtenu (figure 
5B) a ete sequence. Des matrices ont ete generees par 
sonication de I'ADN selon Bankier et al. (1987) en utilisant 
pUC18 comme vecteur. La sequence a ete completee en utilisant 
comme amorce 1 ' oligonucleotide ayant la sequence suivante : 

15 875 CGACGAGGTCGTGCATCAG (SEQ ID N° 44). 

Le sequen^age de I'ADN est realise par la methode de 
Sanger (1977) en utilisant un sequenceur automatise sur les 
matrices d'ADN double brin avec le sequenceur Applied 
Biosystem 373 A. L' assemblage des donnees de sequence a ete 

20 realise avec le logiciel SAP (Staden, 1984). Les sequences 
ont ete analysees en utilisant le logiciel GCG (Devereux, 
1984) . 

Les sequences nucleotidiques obtenues ont permis 
d'etablir la sequence nucleotidique de 8160 bp de la figure 3 
25 (sequence de SEQ ID N° 6) dans laquelle sept ORFs (13-19) ont 
ete identifiees respectivement du nucleotide 43841 au 
nucleotide 44806, du nucleotide 44809 au nucleotide 46053, du 
nucleotide 46109 au nucleotide 46819, du nucleotide 46907 au 
nucleotide 48436, du nucleotide 4843 6 au nucleotide 49638 >-;^U7 
3 0 nucleotide 49679 au nucleotide 5114 5 et du nucleotide 51177 
au nucleotide 51755 (numerotes dans la figure 3 a partir du 
site BajnHI situe a I'extremite 5' du gene ermE) (respective- 
ment sequence de SEQ ID 6 du nucleotide 242 au nucleotide 
1207, du nucleotide 1210 au nucleotide 2454, du nucleotide 
35 2510 au nucleotide 3220, du nucleotide 3308 au nucleotide 
4837, du nucleotide 4837 au nucleotide 6039,* du nucleotide 
6080 au nucleotide 7546 et du nucleotide 7578 au nucleotide 
8156) et correspondant respectivement aux genes eryBIV, 
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er-yBV, eryCVI, eryBVI, eryCIV, eryCV et eryBVII, selon Liu et 
Thorson (1994) dont les caracterisations f onctionnelles 
n'avaient pas encore ete identifiees. Les sept ORFs (13-19) 
sont dans la irieme direction, la lecture se faisant a partir 
5 de la region 5' du gene eryAI. 

Des echantillons de E. coli XLl-blue contenant la region 
codante des ORFs ci-dessus ont ete deposes a la Collection 
Nationale de Cultures de Microorganismes (CNCM) INSTITUT 
PASTEUR, 25, Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, 
10 le 16 juillet 1997 : 

- le plasmide pBK6-12 comprenant la sequence codante pour 
l'ORF13 et pour une partie de l'ORF14 sous le numero 1-1898 

- le plasmide pNC02 8 comprenant la sequence codante pour les 
ORFs 14 et 15 ainsi que pour une partie des ORFs 13 et 16 

15 sous le numero 1-19 01 et 

- le plasmide pNC062 comprenant la sequence codante pour les 
ORFs 17, 18 et 19 ainsi que pour une partie de l'ORF16 sous 
le numero 1-1900* 

EXEMPLE 12 : construction du plasmide pBIVA. 

20 L'0RF13 etant translationnellement couple a l'ORF14 

situee en aval, une deletion en phase a du etre introduite. 
Un plasmide d' integration, denomme pBIVA et portant cette 
deletion, a ete construit selon le schema de la figure 9A. 
Le plasmide pPSP4 (figure 5B) a d'abord ete construit 

25 par sous-clonage du fragment PvuII-Spel (2,7. kb) isole a 
partir du plasmide pBK6-12 obtenu a I'exemple 11 et du 
fragment SpoT-Pstl (1,6 kb) isole a partir du plasmide pNC028 
obtenu a I'exemple 11 dans le vecteur pUC19 prealablement 
digere a 1/aide des enzymes de restriction SmaT et PstI . '-"^ 

3 0 A partir du plasmide pPSP4 , le plasmide pl9BIVA a ete 

genere en deletant le fragment BcII-NcoI de 510 pb interne a 
l'ORF13 et en lui substituant 4 5 pb venant d'un adaptateur 
synthetique de 54 pb. Cet adaptateur a ete genere par 
appariement des 2 oligonucleotides complementaires ayant les 

3 5 sequences suivantes 
SEQ A 

AATTGATCAAGGTGAACACGGTCATGCGCAGGATCCTCGAGCGGAACTCCATGGGG 
(SEQ ID 4 5) et 
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SEQ B 

CCCCATGGAGTTCCGCTCGAGGATCCTGCGCATGACCGTGTTCACCTTGATCAATT 
(SEQ ID 46) 

creant un site Bell et un site NcoT encadrant la sequence de 
5 45 pb. 

Pour I'appariement , les deux oligonucleotides ont ete 
mis a une concentration finale 1,8 /xM dans le tampon 
d'hybridation NaCl 50 mM, Tris, HCl 20 mM pH 7,4, MgCl2/6H20 
2 mM, chauffes pendant 5 mn a 100 **C puis refroidis lentement 

10 a temperature ambiante. Apres digestion avec les enzymes de 
restriction Ncol et BcII , une ligature a ete effectuee dans 
le plasmide pPSP4 dont le fragment BcII-NcoI de 510 pb avait 
prealablement ete elimine. A partir du plasmide pl9BIVA ainsi 
genere, le fragment SacI-^coRI (2,2 kb) portant l'ORF13 

15 modifiee a ete sous-clone dans le plasmide pUWIj218 prealable- 
ment digere avec les enzymes de restriction Sad et f:coRI, Le 
plasmide d' integration pBIVA ainsi obtenu (figure 9B) a ete 
ensuite transfere dans la souche E. call DHSaMRC, puis 
utilise pour transformer Sac. erythraea. 

2 0 EXEMPLE 13 : construction d'une souclie Sac. erythraea eryBIVA 
(BIV87). 

Une souche dans laquelle le gene eryBIV porte une 
deletion interne telle que celle introduite dans le plasmide 
pBIVA obtenu a I'exemple 12 a ete preparee par transformation 
2 5 des protoplastes de Sac. erythraea avec le plasmide pBIVA. 
La preparation des protoplastes, le processus 
d' integration et la selection des mutants ayant le phenotype 
ery" orit ete realises comme a I'exemple 3. 

De plus, la presence de la deletion attendue dans le - — ^ 
30 chromosome (deletion de 510 bp du nucleotide 43872 au 
nucleotide 44382 de la sequence de la figure 3) et son 
remplacement par la sequence synthetique de 4 5 pb a ete 
confirmee par analyse genomique par Southern blot ainsi que 
par PGR selon les conditions decrites a I'exemple 3. 
3 5 Par hybridation Southern sur I'ADN genomique digere par 

1' enzyme de restriction Xhol , en utilisant comme sonde: 
1' oligonucleotide B4-R ayant la sequence suivante 
B4-R AACTCGGTGGAGTCGATGTCG^CGCTGCGGAA (SEQ ID N*» 47) 
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correspondant au brin complementaire de la region d'ADN 
situee de la position 44687 a la position 44718 de la 
sequence de la figure 3, une bande de 5,4 kb a partir de la 
souche sauvage et une bande de 2,7 kb a partir du mutant , 
5 BIV87 ont ete detectees . Les resultats montres a la figure 15 
indiguent la presence d'un site Xhol supplement a ire a une 
distance de 2,7 kb en amont du site Xhol situe a la position 
47114 de la sequence de la figure 3 confirmant ainsi 
1' incorporation de I'adaptateur dans le chromosome de mutant, 

10 telle qu'attendue par 1' incorporation de I'adaptateur 

synthetique ci-dessus utilise pour generer le plasmide pBIVA. ■ 

L' amplification par PGR a ete effectuee en utilisant 
1' oligonucleotide ayant la sequence suivante 
B4-S CAATATAGGAAGGATCAAGAGGTTGAC (SEQ ID N° 48) 

15 correspondant a la region d'ADN situee de la position 43652 a 
la position 43678 de la sequence de la figure 3 et 
1' oligonucleotide B4-R ayant la sequence indiquee ci-dessus, 
permettant d'encadrer par amplification PGR la region portant 
la deletion interne a l'ORF13. L'analyse par amplification 

2 0 par PGR a permis de detecter une bande d' environ 1 kb dans la 

souche sauvage et une bande d' environ 5 00 pb dans le mutant 
BIV87 de fagon identique au signal obtenu avec le plasmide 
pBIV87 (figure 16) • 

L' ensemble des resultats d' analyse par Southern et par 
25 PGR confirme la presence de la deletion de 510 pb et de 

I'adaptateur synthetique au niveau du chromosome du mutant* 

La- souche recombinante ainsi obtenue, designee BIV87, a 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche* S:^^- 

3 0 EXEMPLE 14 : fermentation de la souche BIV87 et identifi- 

cation des metabolites secondaires produits. 

La culture de la souche BIV87 et les analyses par ccm 
ont ete realisees selon les conditions indiquees a I'exemple 
4 . 

3 5 Les resultats de ccm (figure 17) montrent que la souche 

BIV87 accumule pref erentiellement de 1 ' erythronolide B comme 
attendu d'un mutant eryB. 

Des metabolites mineurs""de faibles mobilites manifestant 
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une activite antibiotique ont egalement ete detectes. Ces 
metabolites ont ete extraits et analyses par RP-HPLC couplee 
a la spectrometrie de masse comme decrit a I'exemple 4. 

Les resultats de spectre de masse indiquent que des 
5 formes modifiees de 1' erythromycine A, B, C et D ont ete 

produites, Un metabolite majeur et 3 metabolites mineurs ont 
ete detectes. 

Le metabolite majeur M5 donne un pic parent a m/z 702 
avec des produits de deshydratation et de fragmentation a m/z 

10 684, m/z 560 et m/z 158 et correspond a 1 ' elimination de 2 

atomes d'hydrogene dans 1 erythromycine D (m/z 704, m/z 686). 
La presence de desosaminyl erythronolide B (fragment m/z a 
560) indique que la difference de masse est portee par le 
sucre neutre. La structure proposee pour ce metabolite est la 

15 4"-ceto erythromycine D. 

Les metabolites mineurs donnent aussi un profil avec une 
difference de 2 dans les valeurs m/z respectivement : 

- M6 (m/z a 718, m/z 700, m/z 576, m/z 158) au lieu de m/z 
720, m/z 702 pour 1 ' erythromycine C ; 

20 - M7 (m/z a 732, m/z 714, m/z 576, m/z 158) au lieu de m/z 
734, m/z 716 pour 1 ' erythromycine A ; 

- M8 (m/z a 716, m/z 698, m/z 560, m/z 158) au lieu de m/z 
718, m/z 7 00 pour 1 ' erythromycine B, 

Les structures proposees sont respectivement la 4"-ceto 

2 5 erythromycine C pour M6, la 4"-ceto erythromycine A pour M7 

et la 4"-ceto erythromycine B pour M8 • 

Ces observations indiquent que le gene eryBIV code pour 
la dTDE>-4-ceto-L-6-desoxyhexose 4 -reductase dans la voie de 
biosynthese du dTDP-mycarose . 

3 0 La souche BIV87 a ete depose a la Collection Nationale 

de Cultures de Microorganismes (CNCM) INSTITUT PASTEUR, 25, 
Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, le 16 
juillet 1997 sous le numero 1-1904 
EXEMPLE 15 : construction du plasmide pBVA. 
35 Un plasmide d' integration, denomme pBVA et portant une 

deletion dans le gene eryBV codant pour l'ORF14, a ete 
construit selon le schema de la figure lOA. 

Une deletion de 726 pb a ete generee dans 1'0RF14 du 
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nucleotide 44963 au nucleotide 45688 de la sequence de la 
figure 3 par ligature du fragment BclT-Kpnl (1,1 kb) isole a 
partir du plasmide pBK6-12, obtenu a I'exemple 11, au 
fragment Kpnl-BamHl (1,1 kb) isole a partir du plasmide 
5 pNC028, obtenu a I'exemple 11, dans le plasmide pUWL218 
prealablement digere par 1' enzyme de restriction BajnHI. Le 
plasmide d' integration pBVA ainsi obtenu (figure lOB) a 
ensuite ete transfere dans la souche coli DHSaMRC, puis 
utilise pour transformer Sac. erythraBa. 
10 EXEMPLE 16 : construction d'une souche Sac. GirythjraGa eryBVA 
(BV88) . 

Une souche dans laquelle le gene eryBV porte une 
deletion interne telle que celle introduite dans le plasmide 
pBVA obtenu a I'exemple 15 a ete .preparee par transformation 
15 des protoplastes de Sac. erythraea avec le plasmide pBVA. 

La preparation des protoplastes, le processus 
d' integration et la selection des mutants ayant le phenotype 
ery" ont ete realises comme a I'exemple 3. 

De plus, la presence de la deletion attendue dans le 
20 chromosome (deletion de 726 pb du nucleotide 44963 au 
nucleotide 4 5688 de la sequence de la figure 3) a ete 
confirmee par analyse genomique par Southern blot ainsi que 
par PGR selon les conditions decrites a I'exemple 3. 

Par hybridation Southern sur I'ADN genomique digere par 
25 1' enzyme de restriction Ncol , en utilisant comme sonde 
1' oligonucleotide ayant la sequence suivante : 

B5-R *tCCGGAGGTGTGCTGTCGGACGGACTTGTCGGTCGGAAA (SEQ ID N° 49) 
correspondant au brin complementaire de la region d'ADN 
situee de la position 46060 a la position 46098 de la — 

30 sequence de la figure 3, une bande de 2 , 7 kb a partir de la 
souche sauvage et une bande de 2 , 0 kb a partir du mutant BV88 
ont ete detectees. Les resultats montres a la figure 15 
indiquent chez le mutant la presence d'une deletion d' environ 
7 00 pb dans cette region du chromosome, 

35 . L' amplification par PGR a ete effectuee en utilisant 

1' oligonucleotide ayant la sequence suivante : 
B5-S AGGAGCACTAGTGCGGGTACTGCTGACGTGCTT (SEQ ID N° 50) 
correspondant a la region d'ADN situee de la position 44799 a 
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la position 44831 de la sequence de la figure 3 et 
1' oligonucleotide B5-R ayant la sequence indiquee ci-dessus, 
permettant d'encadrer par amplification PGR la region portant 
la deletion interne a 1'0RF14. L' analyse par amplification 
5 par PGR a permis de detecter une bande d' environ 1,3 kb dans 
la souche sauvage et une bande d' environ 57 0 pb dans le 
mutant BV88 de fagon identique au signal obtenu avec le 
plasmide pBV88 (figure 16) . Ces resultats confirment que la 
deletion de 710 pb detectee par analyse Southern est 
10 identique a celle portee par le plasmide pBVA (726 pb) . 

La souche recombinante ainsi obtenue, designee BV88, a • 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche. 

EXEMPLE 17 : fermentation de la souche BV88 et identification 
15 des metabolites secondaires produits. 

La culture de la souche BV8 8 et les analyses par ccm ont 
ete realisees selon les conditions indiquees a I'exemple 4. 

Les resultats de ccm (figure 17) montrent que la souche 
BV88 accumule pref erentiellement de 1 ' erythronolide B comme 
2 0 attendu d'un mutant eryB. 

Des metabolites mineurs de faibles mobilites ont 
egalement ete detectes puis extra its et identifies par RP- 
HPLC couplee a la spectrometrie de masse selon les conditions 
utilisees a I'exemple 4. 

2 5 Le spectre de masse montre la presence, d'un metabolite 

ayant un pic parent a m/z 560 et des produits de deshydra- 
tation-et de fragmentation a m/z 542 et m/z .158 pour lequel 
la structure proposee est le desosaminyl erythronolide B. 

La sequence eiryBV presente une forte homologie avec^;j 
30 d'autres glycosyltransf erases ainsi qu'avec le gene ez-yGIII 
ci-dessus (60,7 % d'identite au niveau nucleotidique , 44 % au 
niveau proteique) , 

Ces observations indiquent que le gene eryBV code pour 
la mycarosyltransf erase impliquee dans la biosynthese de 

3 5 I'erythomycine, 

EXEMPLE 18 : construction d'un plasmide pCVIA (pPSTI) . 

Un plasmide d' integration , denomme pPSTI et portant une 
deletion dans le gene eryGVI* codant pour I'ORFIS, a ete 
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construit selon le schema de la figure llA de la fagon 
suivante : 

Dans un premier temps, le plasmide pNB4 9 a ete genere 
par traitement a 1 ' exonuclease III du plasmide pNC02 8 obtenu 
5 a I'exemple 11 prealablement digere par les enzymes de 
restriction Nsil et BamHI . Le plasmide pNB49 (figure 5B) 
contenant les nucleotides 44382 a 4 6562 de la sequence de la 
figure 3, a ete ensuite digere a I'aide de 1' enzyme de 
restriction PstI puis traite par la nuclease Mung Bean (NE 

10 Biolabs) comme decrit par Sambrook et al. (1989) . Apres 
religature et transformation dans E. coli XLl-Blue, les 
colonies resistantes a 1 ' ampicilline ont ete select ionnees 
par analyse de restriction avec 1' enzyme Pstl. La perte du 
site Pstl a ete confirmee par sequengage d'un clone en 

15 utilisant 1' amorce M13 inverse et la deletion du nucleotide 
4 63 64 de la sequence de la figure 3 a ete observee creant un 
changement de phase dans I'ORFIS dans le plasmide pNB49APst 
ainsi genere. Le plasmide pIJ702 digere avec 1' enzyme de 
restriction Bglll a ete ensuite ligature au site Bgill du 

20 plasmide pNB49APst generant le plasmide pPSTI . L' orientation 
de pIJ702 dans pPSTI a ete confirmee par la presence d'un 
fragment d'ADN ayant 0,9 kb apres digestion avec 1' enzyme de 
restriction Sphl. Le plasmide d ' integration pPSTI (figure 
IIB) ainsi obtenu a ete transfere dans la souche E. coli 

25 DHSaMRC, puis utilise pour transformer Sac . ■ erythraea . 

EXEMPLE 19 : construction d'une souche Sac. Grythxra^a GjryCVXA 
(PstioJ. 

Une souche dans laquelle le gene eryCVI porte une 
deletion interne telle que celle introduite dans le plasmide- 
3 0 pPSTI obtenu a I'exemple 18 a ete preparee par transformation 
des protoplastes de Sac. erythraea avec le plasmide pPSTI. 

La preparation des protoplastes et le processus 
d' integration ont ete realises comme a I'exemple 3. 

La selection des mutants ayant le phenotype ery" a ete 
35 realisee comme a I'exemple 3 en utilisant une souche 

B. suJbtilis sensible a 1 ' erythromycine au lieu d'une souche 
B. pumllus comme souche indicatrice. La souche B. subtilis 
ATCC 6633 a ete utilisee pour evaluer la production 



wo 99/05283 



PCT/FR98/01593 



46 

d' erythromycins dans des essais biologiques sur des boltes 
d'agar en milieu Ml-102 inoculees avec le mutant a analyser 
et incubees pendant 3 jours a 3 0**C. pes zones d'agar 
recouvertes de bacteries ont ensuite ete prelevees a 
5 I'emporte piece puis placees sur des boltes 2 x TY recou- 
vertes d'une surcouche de 5 ml d'agar en milieu TY contenant 
200 Ml d'une culture de B. subtills ATCC 6633, puis incubees 
une nuit a 37*^0. 

absence de production d'erythromycine a ete evaluee 

10 egalement en presence de precurseurs ajoutes tels que 

I'erythronolide B ou le 3-a-mycarosyl erythronolide B par 
application de 10 m1 d'une solution 10 mM de chaque metabo- 
lite sur les zones d'agar decoupees suivie d'une incubation a 
3 0**C pendant une nuit avant de recouvrir les boltes de la 

15 culture de subtilis comme indique ci-dessus. La souche 
Sac. Brythraea sauvage "red variant" a ete utilisee comme 
controls . 

Apres la transformation des protoplastes avec le 
plasmide pPSTI et la selection des colonies resistantes au 
2 0 thiostrepton, 1 ' integration dans le chromosome a ete 
confirmee par analyse de Southern selon les methodes 
generales decrites a I'exemple 3. 

Un fragment d'ADN de 12 69 pb correspondant a l'ORF14 
genere par PGR en utilisant les oligonucleotides synthetiques 

2 5 ayant les sequences suivantes : 

14-1 GGGGGATCCCATATGCGGGTACTGCTGACGTCCTTCG (SEQ ID N° 51) et 
14-2 X;AAAAGATCTGCCGGCGTGGCGGCGCGTGAGTTCCTC . (SEQ ID N° 52) 
a ete utilise comme sonde. 

L' oligonucleotide 14-1 a ete dessine de facjon a z:''^:zrrZ 

3 0 introduire un site BamHl et un site Ndel en amont de la 

sequence correspondant a la region d'ADN situee de la posi- 
tion 44811 a la position 44833 de la sequence de la figure 3. 

L' oligonucleotide 14-2- a ete dessine de fa^on a intro- 
duire un site Bglll en aval de la sequence correspondant au 
35 brin complementaire de la region d'ADN situee de la position 
46027 a la position 46053 de la sequence de la figure 3. 
L'ADN chromosomique prealablement digere avec les enzymes de 
restriction Clal et PstI a montre les bandes attendues de 
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4 kb et 7 Icb a partir de 1' integrant alors que la souche 
sauvage presentait la bande de 3 kb attendue. 

Apres cultures repetees des integrants, les colonies 
individualisees obtenues ont ete analysees pour la sensi- 
5 bilite au thiostrepton et la production d' erythromycine, puis 
1' integration de la deletion attendue (deletion du nucleotide 
46364 de la sequence de la figure 3) dans le chromosome d'un 
clone mutant ayant le phenotype ery" (PstlO) a ete confirmee 
par analyse de Southern- L'ADN chromosomique, isole respecti- 

10 vement a partir de la souche sauvage et du mutant PstlO, a 
ete digere avec 1' enzyme de restriction PstI . L'hybridation 
avec la sonde Pstl-Ncol de 0,8kb (nucleotides 46368 a 47142 
de la sequence de la figure 3) a donne le profil attendu avec 
une bande PstI de Ikb correspondant aux nucleotides 4 63 68 a 

15 47397 de la sequence de la figure 3 a partir de la souche 

sauvage et avec une bande >2 0 kb a partir du mutant • La perte 
du site PstI a la position 46368 ci-dessus a aussi ete 
montree apres double digestion par les enzymes PstI et Ncol , 
resultant en une bande PstT-Ncol de 0,8 kb (nucleotide 46368 

20 a 47142) a partir de la souche sauvage et une bande Ncol de 
2,8 kb (nucleotide 44382 a 47142) avec le mutant. 

La souche recombinante ainsi obtenue, designee PstlO, a 
ensuite ete cultivee pour identifier les metabolites 
produits . 

25 EXEMPLE 2 0 : fermentation de la souche PstlO et identifica- 
tion des metabolites secondaires produits. 

La souche PstlO a ete cultivee dans le milieu sucrose- 
succinate decrit par Caffrey et al. (1992) pendant 3 jours a 
3 0*'C. Le surnageant de culture a ete ensuite extrait a pH~y~: 

3 0 avec de 1' acetate d'ethyle.Les phases organiques obtenues ont 
ete sechees sur S0^Mg2 puis amenees a sec sous pression 
reduite- Le residu a ete dissdus dans le melange 
acetonitrile-eau (1:1, v/v) , puis a ensuite ete analyse par 
spectrometrie de masse sur un spectrometre BioQ (Micromass, 

3 5 Manchester, UK) ou Finningan LCQ (Finningag, CA) . 

La production d' erythomycine A (m/z 734 et m/z 716) n'a 
pas ete observee mais la presence d' erythronolide B (MK+ : 
m/z 441 et MNa-h : m/z 425) ainsi que de 3-a-mycarosyl 
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erythronolide B (MK+* : m/z 585 et MNa4- : m/z 569) mise en 
evidence caracterise la souche PstlO comme un mutant ejryC. 

La sequence eryCVl presente une forte homologie avec 
d'autres methyltransf erases telles que SnoX impliquee dans la 
5 biosynthese de la nogalamycine chez S, nogalater (numero 
d'accession EMBL S52403) (55,5 % d'identite au niveau 
proteique) , TylMl impliquee dans la biosynthese de la 
tylosine chez S. fradiae (numero d'accession EMBL X81885) 
(65 % d'identite au niveau proteique) et SrmX impliquee dans 
10 la biosynthese de la spiramycine chez S, ambofaciens (numero 
d'accession EMBL S25204) (52,8 % d'identite au niveau 
proteique) . 

Ces observations indiquent que le gene eryCVI code pour 
la dTDP-D-6-desoxyhexose 3 -N-inethy Itransf erase impliquee 
15 dans la voie de biosynthese de la dTDP-D-desosamine . 
EXEMPLE 21 : construction d'un plasmide pBViA (pXhoI) . 

Un plasmide d' integration, denomme pXhoI et portant une 
deletion dans le gene eryBVI codant pour l'ORF16, a ete 
construit selon le schema de la figure 12A de la fagon 
2 0 suivante : 

Le fragment Ncol-Xhol (3,1 kb) du plasmide pNC062 obtenu 
a I'exemple 11 et contenant les nucleotides 47142 a 50254 de 
la sequence de la figure 3 a ete sous-clone dans les sites 
Ncol et Xhol du plasmide Litmus 28. Le plasmide pNC062X 

25 (figure 5B) ainsi genere a ete digere avec 1' enzyme de 
restriction PstI puis traite avec I'ADN polymerase T4 
(Boehringer Mannheim) • Apres religature et transformation 
dans -ET* coli XLl-Blue, la perte du site PstI au nucleotide 
473 97 de la sequence de la figure 3 a ete confirmee par i 

30 sequen9age et une deletion de 60 pb du nucleotide 47337 au 
nucleotide 47397 de la sequence de la figure 3 ont ete 
observes. Le plasmide pIJ702 digere avec 1' enzyme de 
restriction Bglll a ete ensuite ligature au site Bglll de 
cette contruction. L' orientation de pIJ7 02 dans la construc- 

35 tion a ete confirmee par la presence d'un fragment d'ADN 
ayant 4,3 kb apres digestion avec 1 ' enzyme de restriction 
Xhol. Le plasmide d' integration pXhoI (figure 12B) ainsi 
obtenu a ete utilise pour tifansformer Sac. erythraea. 
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EXEMPLE 22 : construction d'une souche Sac. ejrythraea. exyBVIA 
(Xho9l) • 

Une souche dans laquelle le gene eryBVI porta une 
deletion interne telle que celle introduite dans le plasmide 
5 pXhoI obtenu a I'exemple 21 a ete preparee par transformation 
des protoplastes de Sac. Brythraea avec le plasmide pXhoI • 

La preparation des protoplastes et le processus 
d' integration ont ete realises comme a l^exemple 3- 

La selection et 1' analyse des mutants ayant le phenotype 
10 ery~ a ete realisee selon les conditions decrites a I'exemple 
19 . 

L' integration dans le chromosome et la presence de la 
deletion . attendue ont ete confirmees par analyse de Southern 
selon les methodes generales decrites a I'exemple 19. 
15 Apres la transformation des protoplastes avec le 

plasmide pXhoI et la selection des colonies resistantes au 
thiostrepton, 1 ' integration dans le chromosome a ete 
confirmee par analyse de Southern. En utilisant comme sonde 
le fragment PstI de 3 , 3 kb du plasmide pNC062 , I'ADN 
20 chromosomique d'un integrant prealablement digere avec les 

enzymes de restriction PstI et Bglll a montre les bandes 3 kb 
et 6 kb attendues . 

Apres cultures repetees des integrants, les colonies, 
individualisees obtenues ont ete analysees pour la sensi- 
25 bilite au thiostrepton et la production d' erythromycine , puis 
1' integration de la deletion attendue (deletion de 60 pb du 
nucleotide 47338 au nucleotide 47397 de la sequence de la 
figure' 3) dans le chromosome d'un clone mutant ayant le 
phenotype ery~ (Xhol) a ete confirmee par analyse de J"^ 
30 Southern. L'ADN chromosomique, isole respectivement a partir 
de la souche sauvage et du mutant Xhol, a ete digere avec 
1' enzyme de restriction PstI. L' hybridation avec la sonde 
Pstl-Ncol de 0,8 kb (nucleotides 46368 a 47142 de la sequence 
de la figure 3) a donne le profil attendu avec une bande PstI 
35 de 1 kb correspondant aux nucleotides 46368 a 47397 de la 

sequence de la figure 3 a partir de la souche sauvage et avec 
une bande de 4 kb a partir du mutant indiquant que le site 
PstI a la position 47397 ci-dessus a ete perdu. 
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La perte du site Pstl a la position 47397 a aussi ete 
confirmee par PGR. L'ADN chromosomique a ete soiimis a une 
amplification par PGR en utilisant les amorces correspondant 
respectivement a la sequence du nucleotide 473 00 au nucleo- 
5 tide 57320 et a la sequence du nucleotide 47661 au nucleotide 
47636 de la sequence d la figure 3. Un fragment attendu de 
306 pb a ete ainsi amplifie a partir de la souche sauvage 
generant apres digestion avec 1' enzyme de restriction Pstl 
deux bandes d'environ 100 et 300 pb. A partir du mutant 

10 Xho91, un fragment de 3 00 pb a ete amplifie, resultant de la 
deletion de 60 pb. Ce fragment a ete ensuite isole et a ete 
trouve resistant a la digestion par 1' enzyme Pstl. 

La souche recombinante ainsi obtenue et designee Xho91, 
a ensuite ete cultivee pour identifier les metabolites 

15 produits. 

EXEMPLE 2 3 : fermentation de la souche Xho9l et identifi- 
cation des metabolites secondaires produits. 

La culture de la souche Xho91 et 1' analyse du surnageant 
de culture par spectrometrie de masse ont ete realisees selon 
20 les conditions decrites a I'exemple 20. 

La production. d' erythomycine A (m/z 734 et m/z 716) n'a 
pas ete observee mais la presence d'une quantite majoritaire 
d'erythronolide B (MK"^ : m/z 441 ; MNa"*" : m/z 42 5 ; M-H2O 
H"^ : m/z 385) ainsi que la presence de desosaminyl 
25 erythronolide B (m/z 560) mises en evidence . caracterisent la 
souche PstlO comme un mutant eryB. 

Les resultats de spectrometrie de masse, ont ete 
confirmes par spectrometrie de masse en haute resolution sur 

un spectrometre Brucker FT-ICR (Brucker, FRG) . 

3 0 La sequence eryBVI presente une forte homologie avec 

DnmT impliquee dans la biosynthese de la daunorubicine chez 
S. peucBtius (numero d'accession EMBL U77891) (43,9 % 
d'identite au niveau proteique) . 

Ces observations indiquent que le gene eryBVI code pour 
35 la dTDP-4-ceto-L-6-desoxyhexose 2 , 3-deshydratase impliquee 
dans la biosynthese du dTDP-mycarose, comme suggere par 
Scotti et Hutchinson, 1996. 

EXEMPLE 2 4 : construction du plasmide pCIVA. 
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Un plasmide d' integration, denomine pCIVA et portant une 
deletion dans le gene eryCIV codant pour I'ORFIV, a ete 
construit selon le schema de la figure 13A de la faq:on 
suivante : 

5 Le plasmide pNC062 obtenu a I'exemple 11 a ete digere a 

I'aide des enzymes de restriction Ball et BcII de fa^on a 
eliminer un fragment ayant 949 pb a I'interieur de I'ORFl? du 
nucleotide 48650 au nucleotide 49598 de la sequence de la 
figure 3. Apres remplissage des extremites a I'aide du 

10 fragment de Klenow de I'ADN polymerase I, le plasmide a ete 
religature et transforme dans coli XLl-blue. A partir du 
plasmide pBCB17 ainsi genere, le fragment de 2,68 kb portant 
la deletion a ete isole par digestion a I'aide des enzymes 
XJbal et SphI, puis sous-clone dans les sites correspondant du 

15 plasmide pUWL218. La presence de la deletion de 949 pb du 
nucleotide 48650 au nucleotide 49598 de la sequence de la 
figure 3 a ete confirmee par sequen9age. Le plasmide 
•d' integration pCIVA ainsi obtenu (figure 13B) a ensuite ete 
transfere dans la souche E. coli DHSaMRC, puis utilise pour 

2 0 transformer Sac. erythraea. 

EXEMPLE 2 5 : construction d'une souche Sac. erythraGa eryCIVA 

(CIV89) • 

Une souche, dans laquelle le gene eryCIV porte une 
deletion interne telle que celle introduite dans le plasmide 
25 pCIVA obtenu a I'exemple 24, a ete preparee par transforma- 
tion des protoplastes de Sac. erythraea avec le plasmide 
pCIVA . ' 

La preparation des protoplastes, le processus 
d' integration et la selection des mutants ayant le phenotype " 

3 0 ery" ont ete realises comme a I'exemple 3. 

De plus, la presence de la deletion attendue dans le 
chromosome (deletion de 949 bp du nucleotide 48650 au 
nucleotide 4 959 8 de la sequence de la figure 3 a ete 
confirmee par analyse genomique par Southern blot ainsi que 
35 par PGR selon les conditions decrites a I'exemple 3. 

Par hybridation Southern sur I'ADN genomique digere par 
1' enzyme de restriction Ncol, en utilisant comme sonde 
1' oligonucleotide ayant la sequence suivante : 
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C4-R AGCGGCTTGATCGTGTTGGACCAGTAC (SEQ ID N« 53) 

correspondant au brin complementaire de la region d'ADN 
situee de la position 49996 a la position 50022 de la 
sequence de la figure 3, une bande de 6 , 2 kb a partir de la 
5 souche sauvage et une bande de 5,2 kb a partir du mutant 

CIVS 9 ont ete detectees. Les resultats montres a la figure 15 
indiquent la presence dans le mutant d'une deletion d' environ 
1 kb dans cette region du chromosome* 

amplification par PGR a ete effectuee en utilisant 

10 1' oligonucleotide ayant la sequence suivante : 

C4-S GGCCTATGTGGACTACGTGTTGAACGT (SEQ ID N° 54) 

correspondant a la region d'ADN situee de la position 48169 a 
la position 48195 de la sequence de la figure 3 et 
1 ' oligonucleotide C4-R ayant la sequence indiquee ci-dessus, 

15 permettant d'encadrer par amplification PGR la region portant 
la deletion interne a I'ORFIV. L'analyse par amplification 
par PGR a permis de detecter une bande de 1,8 kb dans la 
souche sauvage et une bande de 9 00 pb dans le mutant CIVS 9 de 
faq:on identique au signal obtenu avec le plasmide pCIVA. Les 

20 resultats montres a la figure 16 confirment que la deletion 
d' environ 900 pb detectee par l'analyse Southern est 
identique a celle portee par le plasmide pCIVA (949 pb) - 

La souche recombinante ainsi obtenue, designee CIV89, a 
ete ensuite cultivee pour identifier les metabolites produits 

2 5 par la souche. 

EXEMPLE 2 6 : fermentation de la souche CIV89 et identifica- 
tion des metabolites secondaires produits. 

La culture de la souche CIV89 et les analyses par ccm 
ont ete realisees selon les conditions indiquees a '" J 

3 0 I'exemple 4. 

Les resultats de ccm (figure 17) montrent que la souche 
CIV89 accumule pref erentiellement du B-a-mycarosyl erythrono- 
lide B ainsi que de 1 ' erythronolide B comme attendu d'un 
mutant eryC. 

35 Des metabolites mineurs de faibles mobilites ont ete 

egalement detectes, puis extraits et analyses par RP-HPLC 
couplee a la spectrometrie de masse selon les conditions 
utilisees a I'exemple 4. ' 
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Un metabolite mineur donne un pic parent a m/z 720 et 
des produits de deshydration et de fragmentation a m/z 702, 
m/z 576 et m/z 174 • Le pic 174 peut correspondre a la 
4-hydroxydesosamine et le pic 576 au -4 ' -hydroxydesosaminyl 
5 erythronolide B. 

Ces resultats suggerent que la difference de m/z de 16 
comparee a 1 ' erythromycine D (pic parent m/z 7 04) est portee 
par le sucre amine. La structure proposee pour ce metabolite 
est la 4 '-hydroxy erythromycine D, 
10 Ces observations indiquent que 1' enzyme est impliquee 

dans le retrait du groupement hydroxyle dans la voie de 
biosynthese de 1 ' erythromycine et que le gene eryCIV code 
pour la dTDP-6-desoxyhexose 3 , 4-deshydratase . 

La souche CIV89 a. ete deposee a la Collection Nationale 
15 de Cultures de Microorganismes (CNCM) INSTITUT PASTEUR, 25, 
Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, le 16 
juillet 1997 sous le numero 1-1905 • 
EXEMPLE 2 7 : construction du plasmide pCVA • 

Un plasmide d' integration, denomme pCVA et portant une 
20 deletion dans le gene eryCV codant pour I'GRFIS, a ete 
construit selon le schema de la figure 14 A de la facpon 
suivante : 

Le fragment Ball-BamHl (3,48 kb), obtenu a partir du 
plasmide pNC062 prepare a I'exemple 11 par digestion avec les 

25 enzymes de restriction Ball et BamHl , a ete sous-clone dans 
les sites Smal-BamHl du vecteur pUC19. Du plasmide resultant 
pBABlB (figure 5B) , le fragment interne Seal (Ikb) a ete 
ensuite' delete par digestion avec 1' enzyme Seal pour generer 
une deletion de 1044 pb du nucleotide 49998 au nucleotide -'^ 

30 51041 de la sequence de la figure 3 dans I'ORFIS, Du plasmide 
pBABACV ainsi obtenu, le fragment portant la deletion a 
ensuite ete reisole a partir du polylinker de pUC19 par 
digestion avec les enzymes de restriction Hindlll et -EcoRI, 
puis sous-clone dans le plasmide pUWL218. Le plasmide 

35 d' integration pCVA ainsi obtenu (figure 14B),a ete transfere 
dans la souche E, coli DH5aMRC, puis utilise pour transformer 
Sac. erythraea. 

EXEMPLE 2 8 : construction d'line souche Sac. GjrythraGa eryCVA 
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(CV90) . 

Une souche dans laquelle le gene eryCV porte una 
deletion interne telle que celle introduite dans le plasmide 
pCVA obtenu a I'exemple 27 a ete preparee par transformation 
5 des protoplastes de Sac. erythraea avec le plasmide pCVA. 

La preparation des protoplastes, le processus 
d' integration et la selection des mutants ayant le phenotype 
ery" ont ete realises comme a I'exemple 3. 

De plus, la presence de la deletion attendue dans le 
10 chromosome (deletion de 1044 pb du nucleotide 49998 au 

nucleotide 51041) a ete confirmee par analyse genomique par 
Southern blot ainsi que par PGR selon les conditions decrites 
a I'exemple 3, 

Par hybridation Southern sur I'ADN genomique digere par 

15 1' enzyme de restriction Ncol, en utilisant comme sonde 
1' oligonucleotide ayant la sequence suivante : 
C5-R AACGCCTCGTCCTGCAGCGGAGACACGAACA (SEQ ID N° 55) 

correspondant au brin complementaire de la region d'ADN 
situee de la position 51229 a la position 51259 de la 

2 0 sequence de la figure 3, une bande de 6,2 kb a partir de la 
souche sauvage et une bande de 5 , 1 kb a partir du mutant CV9 0 
ont ete detectees. Les resultats montres a la figure 15 
indiquent chez le mutant la presence d'une deletion d' environ 
1,1 kb dans cette region du chromosome. 

25 L'amplif ication par PGR a ete effectuee en utilisant 

1' oligonucleotide ayant la sequence suivante : 
C5-S .TTCGCTGCGCGATGAAGACAACTGGTA (SEQ ID N*^' 56) 

correspondant a la region d'ADN situee de la position 49668 a 
la position 49694 de la sequence de la figure 3 et 

30 1' oligonucleotide G5-R ayant la sequence indiquee. ci-dessus, 
permettant d'encadrer par amplification PGR la region portant 
la deletion interne a I'ORFIS. L' analyse par amplification 
par PGR a permis de detecter une bande d' environ 1,6 kb dans 
la souche sauvage et une bande d' environ 500 pb dans le 

3 5 mutant CV9 0 de faqzon identique au signal obtenu avec le 

plasmide pGVA. Les resultats montres a la figure 16 confir- 
ment que la deletion d' environ 1 , 1 kb detectee par 1' analyse 
Southern est identique a celle portee par le plasmide PGVA 
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(1044 pb) . 

La souche recombinante ainsi obtenue, designee CV90, a 
ete ensuite cultivee pour identifier les metabolites produits 
par la souche . 

5 EXEMPLE 2 9 : fermentation do la souche CV9 0 et identification 
des metabolites secondaires produits. 

La culture de la souche CV90 et les analyses par ccm ont 
ete realisees selon les conditions indiquees a I'exemple 4, 

Les resultats de ccm (figure 17) montre que la souche 
10 CV90 accumule pref erentiellement du 3-Q:-inycarosyl erythrono- 
lide B ainsi que de 1 ' erythronolide B comme attendu d'un 

mutant eryC- 

La sequence des residus 38-50 ( VTGAGDGDADVQA) 

Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gin Ala 
15 (SEQ ID N*^ 61) 

de la proteine codee par eryCV (sequence de SEQ ID N*> 11) est 

proche de la sequence consensus de liaison au NAD+ decrit par 

Wierenga et al. , 1985 et par Scrutton et al., 1990. 

Ces observations permettent de conclure que le gene 
2 0 eryCV code pour une reductase qui interviendrait comme une 

dTDP-4 , 6-desoxyhexose 3 , 4-reductase dans la voie de bio- 

synthese de la d-TDP-desosamine . 

EXEMPLE 3 0 : surexpression du produit du gene eryCIII dans 
E. coli. 

25 L' expression heterologue du produit du gene eryCIII de 

Sac. erythraea correspondant a I'ORFS decrite a I'exemple 1 
et coda-nt pour I'activite desosaminyltransf erase identifiee a 
I'exemple 7 a ete realisee en utilisant E. coli comme souche 
hote. La proteine ainsi produite sous forme de corps —-^ ' 

30 d' inclusion a ete ensuite purifiee et son activite 
enzymatique determinee in vitro. 

1) Expression de la proteine EryCIII dans E. coll 

L' expression a ete realisee en utilisant le vecteur 
pETlla (Stratagene) pour le clonage et 1' expression de 
3 5 proteines recombinantes dans E. coli sous le controle du 
promoteur de I'ARN polymerase du bacteriophage T7 . 

Dans un premier temps, le gene eryCIII a ete amplifie a 
partir du plasmide pK62 decrit a I'exemple 1 de la fagon 
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suivante : 

L'amplif ication par PGR a ete effectuee en utilisant la 
polymerase Native Pfu (Stratagene) et coiimie amorces 
1 ' oligonucleotide A homologue au brin codant du gene eryCIII 
5 ayant la sequence 

A GAAGGAGATATACATATGCGCGTCGTCTTCTCCTC (SEQ ID N° 57) 

permettant d'introduire un site Ndel en amont de I'ATG 
initiateur de eryCIII et 1' oligonucleotide B homologue au 
brin complementaire du gene eryCIII ayant la sequence 

10 B CGGGATCCTCATCGTGGTTCTCTCCTTCCTGC (SEQ ID 58) 

permettant d'introduire un site BamHl en aval du codon stop 
du gene eryCIII. 

L'ADN amplifie a ete ensuite digere par les enzymes de 
restriction Ndel et BamHl , puis le fragment Ndel-BamKl de 

15 1,2 kb obtenu contenant la totalite du gene eryCIII a ete 

ligature dans le vecteur d' expression pETlla (Stratagene) qui 
contient le gene jS-lactamase de resistance a 1 ' ampicilline , 
I'origine de replication ColEl et le promoteur du gene de 
I'ARN polymerase T7 situe en amont du site de clonage Ndel, 

20 prealablement digere avec les enzymes de restriction Ndel et 
BajnHI. Apres ligation et transformation dans E. coli XLl- 
blue, le plasmide pCEIII ainsi obtenu a ete confirme par 
carte de restriction et sequengage . 

La souche d'^. coll BL21(DE3) de la trousse pET 

25 (Stratagene) qui contient dans son ADN chromosomique le gene 
lacl^ et le promoteur lacUVS en amont du gene de I'ARN 
polymerase T7 , a ensuite ete transformee par. le plasmide 
pECIIi:5. 

La souche transformee obtenue, denommee BL21/pECIII 
30 ete cultivee en erlen de 50 ml a 37 °C en milieu LB ensemence 
a DOgQQ=0,l a partir d'une preculture, puis induite par 
1 ' isopropyl-)3-D-thiogalactopyranoside (IPTG) ImM a DO^qq^I. 
Apres 3 h 30 d' induction, 1 ml de culture a ete preleve et 
centrifuge, puis le culot bacterien obtenu a ete dissout dans 
35 240 /il d'eau et 120 ^\ de tampon d' echantillon SDS 3X (Tris- 
HCl IM pH = 6,8 : 1,9 ml ; glycerol 3 ml ; )S-mercaptoethanol 
1,5 ml ; SDS 20 % , 3 ml ; bleu de bromophenol 1 % pH = 7 : 
0,3 ml ; HoO qsq 10 ml). A partir de 15 m1 de la solution 
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obtenue, les proteines totales extraites ont ete analysees 
par SDS-PAGE sur un gel a 10 % de polyacrylamide avec une 
coloration au bleu de Comassie. 

La surexpression d'une proteine ayant un poids 
5 moleculaire apparent d' environ 4 6 Kd correspondant au PM 

attendu pour la proteine EryCIII a ete observee comparative- 
ment aux proteines totales d'une souche temoin transforxnee 
par le plasmide pETlla. 
2) Purification de la proteine EryCIII 
10 La souche transformee BL21/pECIII ci-dessus a ete 

cultivee en fermenteur de 6 litres en milieu minimum 
contenant du glycerol comme source de carbone (Korz et al-, 
1995) a 25*C jusqu'a DO^qo^^^' puis induite par I'IPTG 
pendant 18 h jusqu'a D0gQQ==54. A partir du bouillon recolte, 
15 le culot bacterien contenant des corps d' inclusion a ete 
isole par centrif ugation a 5000 g pendant 3 0 mn. 

L' induction de la proteine EryCIII a ete controlee par 
SDS-PAGE (gradient de polyacrylamide : 10 a 20 %) et avec une 
coloration au bleu de Comassie apres lyse sur un aliquot dans 
2 0 le tampon SDS 1 %, a 100*=»C pendant 5 min, soit directement 
sur le bouillon recolte, soit sur le culot bacterien apres 
une premiere lyse par sonication dans un tampon phosphate. 

190 g de culot bacterien correspondant a 1 litre de 
bouillon recolte ont ete remis en suspension dans 2,5 volumes 

2 5 de tampon KH2PO4/K2HPO4 2 0 mM pH 7,2 contenant de I'EDTA 

2,5 mM et du DTT 2,5 mM, Les cellules ont ete ensuite lysees 
en utilisant un appareil Rannie (Mini-Lab, type 8-30H, APV 

Homogenisers As, Denmark) avec trois passages sous une ^ 

pression de 1000 bars, Apres centrif ugation a 46.000 g . 

3 0 pendant 3 heures, le culot obtenu a ete mis en suspension 

dans 2,5 volumes d'uree 2M puis centrifuge dans les memes 
conditions. 

Le culot ainsi lave a ete ensuite mis en suspension dans 
2,5 volumes d'une solution d'uree 7M dans du tampon tris 
35 50 mM pH 7,5 (tampon A) de fagon a solubiliser la proteine 
EryCIII. Apres centrif ugation dans les memes conditions, le 
surnageant recueilli obtenu contient 2 , 1 g de proteines 
totales determinees par la methode de Bradford en utilisant 
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une trousse du commerce (Pierce) . 

L'extrait dans I'uree 7M a ete ensuite charge a la 
Vitesse de 0,5 metres/h et a 4-8 ®C sur une colonne de 180 ml 
(5 cm X 9 cm) de Q sepharose (Pharmacia) prealablement 
5 equilibree avec le tampon A ci-dessus et avec une detection a 
280 nm. La proteine EryCIII a ete ensuite eluee avec le 
tampon A contenant NaCl 0,3M. Les fractions reunies, 
contenant la proteine EryCIII, mise en evidence par SDS-PAGE 
(gradient de polyacrylamide : 10 a 20 %) revelee par 

10 coloration au bleu de Comassie et 835 mg de proteines 

totales, ont ete ensuite chargees sur une. colonne de 5,5 
litres (10 cm X 70 cm) de Superdex 200 Prep grade (Pharmacia) 
prealablement equilibree avec le tampon A ci-dessus. Par 
elution de la colonne avec le tampon A et par detection a 

15 280 nm, un pic de proteine a ete obtenu dont les fractions 
contenant la proteine EryCIII mise en evidence par SDS-PAGE 
et 200 mg de proteines totales ont ete reunies puis purifiees 
sur une colonne de 180 ml (5 cm x 9 cm) de Q Source 
(Pharmacia) prealablement equilibree avec le tampon A. Par 

20 elution avec un gradient lineaire de NaCl variant de 0 a 

0,3 M dans le tampon A, 30 ml de solution contenant 100 mg de 
proteine EryCIII denaturee homogene en purete evaluee par 
SDS-PAGE, avec une revelation au nitrate d' argent, ont ete 
obtenus . 

25 La figure 18 montre 1' evolution de la purete de la 
proteine EryCIII suivie par SDS-PAGE (gradient de 
polyacrylamide : 10 a 15 %) pour un depot de 500 ng de 
proteines totales et une revelation au nitrate d' argent 
success ivement apres extraction a I'uree 7M (ligne 2), 

30 chromatographie Q sepharose (ligne 3) , chromatographie 

Superdex (ligne 4), chromatographie Q source (ligne 6) par 
rapport aux marqueurs de poids moleculaire (lignes 1 et 5) . 

La proteine EryCIII a ete ensuite renaturee par dilution 
de I'eluat homogene avec une solution de tampon A contenant 

3 5 du DTT 10 mM pour obtenir une concentration finale en 
proteine de 0,1 mg/ml. La solution diluee a ete ensuite 
dialysee centre du tampon Tris 50 mM ; NaCl 0,15 M ; 0,3 % 
n-octyl-)3-D-glucopyranosyl (NOG) ; DTT 10 mM, pH 8,3 puis 
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concentres a 4 mg/ml par ultrafiltration sur une membrane 
PLGC04310 (Millipore) ayant un seuil de coupure de 10.000. 

La proteine EryCIII purifiee a ete ensuite conservee a 
I'etat congele a -20 ''C en aliquots de 500 ^1* 
5 3) Caracterisation de la proteine EryCIII 

La caracterisation de la proteine EryCIII ainsi obtenue 
a ete examinee pour les proprietes suivantes : 

a) Homogeneite. 

L'electrophorese par SDS-PAGE (gradient de 
10 polyacrylamide : 10 a 15 %) en utilisant I'appareil Phast 
System (Pharmacia) et une revelation au nitrate d'argent 
montre une purete superieure a 99 % pour un depot de 2000 ng- 

b) Poids moleculaire par electrophorese et spectrometrie de 
masse. 

15 Par electrophorese, un PM apparent de 4 6 kDa a ete 

determine en accord avec le PM calcule de 45929. 

L' analyse par RP-HPLC couplee a la spectrometrie de 
masse (HPLC : ESI-SM) donne une masse de 45934 uma. 

c) Sequence en acide amines N-terminale 

2 0 La sequence N-terminale a ete determinee par 

microsequengage sur un microsequenceur de proteine Model A492 
couple a un analyseur HPLC de PTH-aminoacides (Applied 
Biosystems) . 

Aucune sequence secondaire n'a ete decelee pour les 

2 5 10 premiers residus qui est en accord avec la sequence en 

acides amines decrite a la figure 2 (sequence de SEQ ID 
N° 5) . - 

d) Activite biologique 

L'activite desosaminyl transferase de la proteine _'UZir 

3 0 EryCIII a ete determinee in vitro par la mise en evidence de 

la formation d' erythromycine D a partir de dTDP-D-desosamine , 
dont la preparation est decrite plus loin et de 3-a-mycarosyl 
erythronolide B (MEB) dont la preparation est decrite ci- 
dessus dans Materiels et Methodes generales. 
3 5 Le milieu de reaction contient 150 nmoles de dTDP-D- 

desosamine, 137,4 nmoles de MEB et 1 mg de proteine EryCIII 
en utilisant les conditions operatoires suivantes : 

Dans un tube en verre a vis, on introduit successivement 
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4,78 ml de tampon Tris 50 mM pH 7,3 (tampon B) ; 20 ^1 
dTDP-D-desosamine, sel de triethylamine (150 nmoles) en 
solution dans le tampon B contenant EDTA 1 mM et PEFABLOC O, 
4 mM (Merck) ; 100 /xl de MEB (137,4 nmoles) en solution dans 
5 le tampon B et 1 mg de proteine EryCIII correspondant a 

2 50 /Z.1 d'un aliquot de solution congelee obtenue ci-dessus* 

Apres homogenisation au Vortex, le tube bouche est place 
pendant 5 h dans un bain thermostate a 3 0**C, puis on a juste 
le pH a 9-10 avec NaOH 32 % puis extrait le melange 

10 reactionnel 3 fois avec 5 ml d' acetate d'ethyle^ L' extrait 
obtenu, amene a sec sous press ion reduite, puis repris par 
100 111 de chlorure de methylene est ensuite analyse par ccm 
dans les conditions indiquees a I'exemple 4 en utilisant 
comme eluant le melange chlorure de methylene/methanol 

15 (90 : 10, v/v) . 

Un essai temoin (t = 0) dont 1' incubation est arretee 
immmediatement par I'ajout de NaOH, est effectue dans les 
memes conditions. 

Les resultats obtenus par revelation chimique montrent 

20 1' apparition d'un produit moins mobile ayant un Rf voisin de 
I'erythromycine D attendue et pour lequel une faible activite 
antibiotique est detectee par autobiogramme direct des 
plaques sur B. pumllus . Aucune activite biologique n'est 
observee pour I'essai temoin (figure 19). 

25 Ces resultats confirment que la proteine EryCIII 

produite dans JE^. coli et purifiee ci-dessus a 1' activite 
desoaminyl transferase attendue et a ete correctement 
renaturee . 

EXEMPLE 3 1 : utilisation de la sequence du gene eryCIII cojme 
3 0 sonde pour isoler les genes oleGl et oIeG2 codant pour des 

glycosyltransf erases chez S, ^ntihiotiaus * 

1) clonage des genes oleGl et oleG2 

La sequence du gene eryCIII de Sac. erythraea 

correspondant a I'ORFS decrite a I'exemple 1 codant pour 
3 5 1' activite desosaminyltransf erase a ete utilisee pour 

preparer une sonde d'hybridation et a permis d' isoler des 

genes homologues dans la souche S. antibioticus ATCC 11891 

productrice d ' oleandomycine par hybridation Southern. 
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L' integralite du gene eryCIII a ete amplifiee par PGR a 
partir de 6 ng du plasmide pK62 obtenu a 1' example 1 en 
suivant les conditions operatoires decrites a I'exemple 3 en 
utilisant la polymerase native pfu (Stratagene) et corame 
5 amorces 1 ' oligonucleotide ayant la sequence suivante : 

eryCIII-1 CGGGTACCATGCGCGTCGTCTTCTCCTCCATG (SEQ ID 59) 
comportant un site de restriction Kpnl dans sa region 5' et 
dont la partie 3' correspond au brin complementaire de la 
region d'ADN situee de la position 10196 a la position 10219 
10 de la sequence de la figure 2 et 1 ' oligonucleotide eryCIII2 
ayant la sequence suivante : 

eryCIII-2 CGGGTACCTCATCGTGGTTCTCTCCTTCC (SEQ ID N*=* 60) 
comportant un site Kpnl dans sa region 5' et dont la partie 
3' correspond a la region d'ADN situee de la position 8954 a 

15 la position 8974 de la sequence de la figure 2. 

La bande d' environ 1,2 kb obtenue par amplification a 
ete ensuite digeree par 1' enzyme de restriction Kpnl et 
clonee dans le plasmide pUC19 prealablement digere par 
1' enzyme iCpnl- Le plasmide pCIIIPCRl ainsi obtenu a ete 

20 ensuite utilise pour reisoler le fragment Kpnl de 1,2 kb 
correspondant a 1 ' integralite du gene eryCIII montre a la 

3 2 

figure 2, Le fragment ainsi isole a ete ensuite marque au P 
par la technique "random priming" decrite par Sambrook et 
al., 1989 et utilise comme sonde eryCIII pour analyser par 

2 5 hybridation Southern des clones cosmides obtenus a partir 

d'une banque d'ADN genomique de S. antibioticus ATCC 11891 et 
prepares de la fa^on suivante (figure 20) : , 

- Une serie de six cosmides (cosAB35, cosAB76, cosAB87, 
COSAB67, COSAB63 et cosAB61) se chevauchant et couvrant 

3 0 environ 100 kb de la region correspondant au cluster de genes 

de la biosynthese de 1 ' oleandomycine a ete isolee en suivant 
la methode decrite par Swan et al., 1994 en utilisant comme 
sondes le fragment S;nal de 2 kb interne a la troisieme sous- 
unite de la polyketide synthase de Sac. erythraea dans le 
3 5 cluster de genes de la biosynthese de 1 ' erythromycine (Cortes 
et al., 1990) suivie d'une marche sur le chromosome. Les 
sondes strD, strE et strM codant respectivement pour la dTDP- 
glucose synthase, la dTDP-glucose 4 , 6-deshydratase et la 
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dTDP-6-desoxyglucose 3 , 5-epiinerase de S. griseus (Stockmann 
et Piepersberg, 1992) hybrident avec les cosmides cosAB61 et 
COSAB63 (fig- 20) . De fa?on analogue, par hybridation 
Southern avec la sonde eryCIII preparee ci-dessus effectuee 
5 selon les conditions standard decrites par Hopwood et al. , 
1985, le cosmide cosAB35 (Swan et al., 1994) donne des 
signaux positifs dans deux fragments de restriction Ba;nHI de 
3,51cb et de 2,7 kb representes a la figure 20. Le sous- 
clonage et le sequengage ulterieurs montrent que ces deux 

10 fragments sont separes par un fragment BamHl de 0,6 kb non 
detecte par hybridation, 

Un fragment SstI de 10,8 kb d'ADN genomique de 
5. antihioticus ATCC 118 91 represente a la figure 21, 
correspondant a la partie droite du cluster de genes de la 

15 biosynthese de 1 ' oleandomycine comprise entre le site SstI en 
position 11081 du gene OLE-ORF3 des PKS de la sequence EMBL 
n°L09654) et le site SstI en position 5 de la sequence EMBL 
n^L3 6601 situe a 1 , 4 kb en amont du gene oleB et hybridant 
avec la sonde eryCIII preparee ci-dessus, a ete isole a 

2 0 partir du cosmide cosAB3 5 et sous-clone dans le vecteur 

plasmidique pSLllSO (Pharmacia Biotech) . Le clone pC035-S 
ainsi obtenu a ete utilise pour generer des matrices simple 
brin par sous-clonage de differents fragments d'ADN dans les 
bacteriophages M13mpl8 et MP13mpl9 (New England Biolabs) , 
25 puis la sequence nucleotidique de ces fragments a ete 
determinee selon la methode de Sanger et al, (1977) en 
utilisant une polymerase T7 modifiee (Sequenase version 2.0 
U.S. Biochemicals) en presence d'a[^^S]dCTP (Amersham) et di 
7-deaza-dGTP, selon les recommandations du fournisseur af-iri 

3 0 de limiter les problemes de compression de bandes. Les 

amorces conventionnelles fournies avec la trousse Sequenase 
ainsi que les amorces synthetiques (17mer) internes ont ete 
utilisees. 

L' assemblage des donnees de sequence a ete realise en 
35 utilisant le programme Fragment Assembly (Genetic Computer 
Group, University of Wisconsin) et 1 ' identification des 
phases ouvertes de lecture en utilisant le programme 
CODONPREFERENCE (Devereux et' al., 1984). 
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Les sequences nucleotidiques obtenues ont permis 
d'etablir la sequence nucleotidique de 609 3 bp representee a 
la figure 22 (sequence de SEQ ID N« 15) , comprise entre les 
sites Sphl* et Kpnl montres a la figure 21/ dans laquelle 
5 cinq ORFs ont ete identif iees respectivement du nucleotide 
184 au nucleotide 138 6 (ORF denoimee olePl) , du nucleotide 
1437 au nucleotide 2714 (ORF denoininee oleGl) , du nucleotide 
2722 au nucleotide 3999 (ORF denoitunee oIeG2) , du nucleotide 
3992 au nucleotide 4729 (ORF denommee oleM) et du nucleotide 
10 4810 au nucleotide 5967 (ORF denommee oleY) . Les cinq ORFs 
sont transcrites dans la meme direction. 

Des echantillons de E. coll contenant le plasmide 
pC03 5-S comprenant la region codante des ORFs olePl, oleGl, 
oIeG2, oleM et oieY ont ete deposes a la Collection Nationale 
15 de Cultures de Microorganismes (CNCM) INSTITUT PASTEUR, 25, 
Rue du Docteur Roux 75724 PARIS CEDEX 15 FRANCE, le 8 avril 
1998 sous le numero 1-2003. 

Le gene oleGl code pour un polypeptide ayant 426 acides 
amines (sequence de SEQ ID N° 17) . Cependant, la presence 
2 0 d'un codon CGC codant pour une arginine tres conservee dans 
cette classe de glycosyltransf erase chez les Streptomycetes 
situe immediatement en amont du codon GTG, indiquerait que le 
codon initiateur pourrait etre le codon CTG en position 14 31 
de la sequence SEQ ID N° 17. 
25 Le gene oIeG2 code pour un polypeptide ayant 426 acides 

amines (sequence de SEQ ID 18) . 

La comparaison des sequences en acides ainines deduites 
des ORFs' oleGl et o2eG2 ci-dessus avec les proteines de bases 
de donnees a I'aide du programme Blast (Altschul et al., 
30 1990) a montre des similarites avec des glycosyl transferases 
de differentes sources, notamment environ 72 % de similarite 
et 53 % d'identite avec la deosaminyltransf erase EryCIII 
decrite a I'exemple 30. 

L' identif ication de la fonction du gene oleGl ou du gene 
3 5 oIeG2 a ete ensuite realisee par interruption du gene cible 
dans la souche de 5. amtibioticus ATCC 11891' et par identifi- 
cation d'un precurseur non glycosyle de 1 ' oleandomycine 
produit par la souche mutante en utilisant les methodes 
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decrites dans les exemples 3 a 4 . 

2) generation d'une souche de antibiotlaus oleGlA (A35G1) • 

Une souche dans laquelle le gene oleGl est interrompu a 
ete preparee par integration d'un plasmide pC03 dans les 
5 regions homologues de 1<ADN chromosoxnique de la souche de 
S. ^tibioticus ATCC 118 91 productrice d'oleandomycine. 

Dans un premier temps, le fragment BamHI de 0,6 kb 
interne au gene oleGl, obtenu par digestion du plamide 
pC03 5-S prepare ci-dessus, avec 1' enzyme de restriction BamKX 
10 (figure 21) , a ete sous-clone dans le site BajnHI du plasmide 
pOJ260 NRRL B-14785, 

Le plasmide pC03 ainsi genere a ete ensuite transfere 
dans la souche E. colx TGI recO1504 : : Tn5 (Kolodner et al., 
1985) , puis utilise pour transformer les protoplastes de 
15 S. antibioticus . La selection des transf ormants a ete 
realisee par resistance a I'apramycine (Apramycine pour 
injection,. Rhone Merieux) . 

La preparation des protoplastes a ete realisee a partir 
de la souche S. antibioticus ATCC 11891 en suivant les 
20 conditions decrites par Hopwood et al., 1985. 

La transformation a ete realisee en utilisant 50 /xl 
d'aliquot de protoplastes, 5 ^tg d'ADN plasmidique pC03 et en 
remplatpant le thiostrepton par de I'apramycine a la concen- 
tration finale de 25 ^g/ml. 
25 La selection des integrants effectuee par resistance a 

I'apramycine a permis d'isoler un clone denomme A3 5G1, 

L' alteration attendue dans la region correspondante du 
chromosome de S. antibioticus a ete confirmee par analyse 
genomique par Southern blot, L'ADN chromosomique isole pui- s"'^ 
3 0 digere par 1' enzyme de restriction PstI a partir de la souche 
S. antibioticus sauvage ou du mutant A3 5G1 a ete analyse par 
Southern en utilisant comme sonde d' hybridation le fragment 
BajnHI de 0,6 kb indique ci-dessus. Le remplacement du 
fragment PstI de 4,7 kb ainsi detecte dans la souche sauvage 
3 5 par deux fragments PstI de 2,4 et 6,5 kb dans le mutant A3 5G1 
confirme 1' integration du plasmide pC03 dans' le chromosome de 
la souche A3 5G1 au niveau de I'ORF oleGl, 

La souche recombinante A^5G1 ainsi obtenue a ete ensuite 
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cultivee pour identifier les precurseurs produits par la 
souche . 

3) fermentation de la souche A35G1 et identification des 
precurseurs de I'oleandomycine produits. 

5 La souche A35G1 a ete cultivee pendant 72 h en erlen de 

50 ml dans le milieu EP2 a partir d'une preculture de 48 h en 
milieu EPl dans les conditions decrites a I'exemple 4. 

Les extraits de bouillon avec de 1' acetate d'ethyle ont 
ete ensuite analyses selon les methodes utilisees dans les 
10 exemples 3 et 4 . 

a) L'essai biologique par antibiogramme a ete realise de 
la fa^on suivante : 

Apres croissance de la souche B- pumilus sur milieu TSB 
pendant une nuit a 37°C, la culture a ete diluee a 1/100 dans 
15 du milieu contenant 50 % (w/v) de glycerol, puis la suspen- 
sion cellulaire obtenue a ete conservee a -20°C avant 
utilisation. 

L'essai biologique a ensuite ete effectue en 
introduisant 150 /xl la suspension cellulaire decongelee 
20 dans 100 ml de milieu TSB contenant 1 %.d'agar et maintenu a 
55 °C. Le melange a ete ensuite verse dans des boltes de 
p^tri. Apres ref roidissement , des cylindres oxford contenant 
50 a 200 Ail d'extraits a I'acetate d'ethyle ont ete places 
sur les boltes d'agar, maintenus 2 h a 4°C, puis incubes 
25 pendant une nuit a 37°C. 

Les extraits ne montrent pas d'effet inhibiteur sur la 
croissance de B. pumilus ATCC 14884. 

b)' L' analyse par com par revelation chimique a ete 
effectuee selon les conditions decrites a I'exemple 4 en --^3 
3 0 utilisant comme standards 1 ' erythromycine A, 1 ' erythronolide 
B ainsi que le 6-desoxyerythronolide B, 

L' analyse par ccm montre que la souche A3 5G1 ne produit 
pas d'oleandomycine mais accumule pref erentiellement un 
produit pourpre ayant une mobilite plus grande que 
35 I'erythronolide B et voisine du 6-desoxyerythronolide B et 
que I'on peut attendre de la partie aglycone 8,8a-desoxy- 
oleandolide . 

c) L' analyse par chromatographie RP-HPLC couplee a la 
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spectrometrie de masse a ete realises selon les conditions 
decrites a I'exemple 4. Deux metabolites majeurs, denommmes 
M9 et MIO, ont ete detectes (elution a 6,12 mn et 17,2 3 mn 
respectivement) . Les deux produits donnent un pic parent 
5 m/2 373 et des profils de fragmentation analogues qui peuvent 
etre en accord avec la structure [8 , 8a-desoxyoleandolide]H . 
Cependant seul le temps de retention du metabolite MIO est en 
accord avec la structure proposee alors que le metabolite M9 
pourrait correspondre a une structure isomere ou au noyau 

10 lactone ouvert. 

Des experiences de complementation des souches mutantes 
de Sac. erythraea CIII68 decrite a I'exemple 6 et BV88 
decrite a I'exemple 16 ont ete egalement realisees en 
utilisant des constructions plasmidiques permettant 

15 d'exprimer respectivement chacun des genes oleGl et oIeG2.. 

Ces observations et 1' absence de detection d' oleandrosyl 
8 , 8a-desoxyoleandolide ou de desosaminyl 8 , 8a-desoxyoleando- 
lide indiquent que le gene oleGl code pour la desoaminosyl- 
transf erase et le gene oIeG2 code pour 1 ' oleandrosyltransf e- 

20 rase respectivement impliquees dans la biosynthese de 
1 ' oleandomycine • 

PREPARATION DE L'EXEMPLE 3 0 : Thymidine 5 ' - ( tr ihydrogen- 
diphosphate) ,P'-[3,4/ 6-trideoxy-3- (dimethylamino) -D-xylo- 
hexopyranosyl] ester ^N,N-diethylethanamine 

25 STADE A : chlorhydrate 3 , 4 , 6-trideoxy-3- (dimethylamino) -D- 
xylohexopyranose 

On ajoute sous agitation et a temperature ambiante 
146,6 g d'erythromycine A, a 1,5 litres d'acide chlorhydrique 
6N. On porte la solution obtenue au reflux pendant 2 h. Orv"' 
3 0 refroidit a la temperature ambiante, filtre et lave a I'eau 
le residu obtenu. On extrait la phase aqueuse au chlorure de 
methylene, puis a 1' ether sulfurique. On ajoute a la phase 
aqueuse 10 g de noir et chasse les traces d' ether sous 

pression reduite. On filtre, et concentre. On effectue un 
3 5 second envoi dans les memes conditions. On rassemble les deux 
essais, dissout dans I'ethanol (150 cm^) , ajoute 150 cm^ 
d'ether ethylique. On essore, lave et seche les cristaux 
obtenus. On obtient 42 g de produit recherche. F = 158-160<>C. 
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STADE B : 3,4, 6-trideoxy-3- (dimethylamino) -D-xylo-hexopyra- 
nose, 1, 2-diacetate 

On ajoute sous agitation a 20<'C, 60 cm^ de triethylamine 
dans un melange renfennant 15,27 g de produit du stade A et 
5 150 cm*^ de chlorure de methylene. On ajoute a 2 0*'C une 

3 

solution renfermant 20 cm^ d' anhydride acetique et 8 0 cm de 
chlorure de methylene. On agite a la temperature ambiante 
pendant 2 0 heures. On filtre, lave et concentre. On empSte 
dans 1' ether sulfurique. On concentre le filtrat sous 
10 press ion reduite. On chromatographie le residu obtenu en 

eluant avec le melange acetate d'ethyle-triethylamine (95-5). 
On obtient 18,6 g de produit recherche que I'on utilise tel 
quel dans le stade suivant. 

STADE C : 3,4, 6-trideoxy-3 - (dimethylamino) -D-xylo-hexopyra- 

15 nose, 2 -acetate 

On porte a 50°C un melange renfermant 18,6 g du produit 
du stade B et 50 cm^ de DMF et ajoute 6,62 g d' acetate 
d'hydrazine NH2NH2 , ACOH. On agite le melange reactionnel et 
le verse sur une solution saturee de carbonate acide de 

2 0 sodium. On extrait la phase aqueuse a 1' acetate d'ethyle. On 
rassemble les phases organiques, seche, filtre et concentre. 
On distille sous pression reduite pour eliminer le DMF par 
entralnement azeotrophirque avec le toluene- On obtient 
11,28 g de produit que I'on chromatographie sur silice en 

2 5 eluant avec le melange acetate d' ethyle-triethylamine 
(90-10). On obtient 6,5 g de produit recherche que I'on 
utilise' tel quel dans le stade suivant. 

STADE D : 3 , 4 , 6-trideoxy-3- (dimethylamino) -D-xylo-hexopyra- 
nose, 2-acetate bis (phenylmethyl) phosphate jr.im 
30 On ajoute a -70*C, 5,7 cm^ d'une solution de n-butyl- 

lithium dans I'hexane dans une solution renfermant 1,73 8 g du 
produit du stade precedent et 4 0 cm^ de THF. On ajoute a 

_70 75°C 10 g de dibenzy Iphosphochlorure prepare extempora- 

nement (J. Chem. Soc. 1958, p. 1957), 

35 



O 

// 

CI 



(OCHjCgHg) 
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en solution dans 20 crP de THF. On maintient 1' agitation 
pendant 1 h 30 entre -7 0 et -74**C. On verse sur une solution 
saturee de carbonate acide de sodium, extrait a 1' acetate 
d'ethyle* On seche la phase organique sur sulfate de sodium, 
5 filtre et concentre. On chromatographie le produit obtenu sur 
silice en eluant avec le melange acetone-chlorure de methy- 
lene (5-5) . On obtient 1,070 g du produit recherche. 
STADE E : 3 , 4 , 6-trideoxy-3- (dimethylamino) -D-xylo- 
hexopyranose, 1- (dihydrogen phosphate) ,N,N-diethylethanamine 
10 On place sous agitation et sous courant d'hydrogene 

pendant 3 0 minutes a la temperature ambiante, un melange 

3 

renfermant 1,070 g du produit du stade precedent, 20 cm 

d' acetate d'ethyle, 10 cm^ de methanol, 0,622 cm^ de triethy- 

lamine et 200 mg de palladium sur charbon. On filtre, lave au 

15 methanol et a 1' acetate d'ethyle et concentre le filtrat. On 
obtient 1 g d'une huile a laquelle on ajoute 10 cm-^ de 
methanol. On agite la solution obtenue pendant 20 heures. On 
chasse le methanol sous pression reduite a 30*^0. On obtient 
68 0 g de produit recherche, 

20 STADE F : 3 , 4 , 6-trideoxy-3- (dimethylamino) -D-xy lo- 
hexopyranose, l-( dihydrogen phosphate) 

On dissout 420 mg du produit isole sous forme de sels de 
triethylamine, obtenu au stade precedent, dans 1,6 cm de 
methanol. On ajoute 3,2 cm^ d' ether sulfurique. On ajoute 

25 ensuite 6,4 cm"^ d' ether sulfurique. On obtient 250 mg de 
produit recherche fondant a 242-244*=*C. 

STADE G : Thymidine 5 ' - ( trihydrogen diphosphate) , P 3 , 4 , 6- 

trideoxy-3- (dimethylamino) -D-xy lo-hexopyranosy 1 ] ester , N , N- 

diethylethanamine ,""11^ 

3 

30 On melange 228 mg du produit de la preparation 1, 6 cm 

de pyridine et 544 mg de thymidine 5 ' -monophosphate morpholi- 
ctate-4-morpholine-NN'-dicyclohexylcarboxamidine. On chasse la 
pyridine sous pression reduite au rotorvapor en maintenant la 
temperature a 30*»C ou en dessous. On ajoute 6 cm^ de pyridine 

3 5 que I'on chasse sous pression reduite. On repete 1' operation 
2 fois. On ajoute 6 cm-^ de pyridine, 105 mg' de IH-tetrazole . 
On agite pendant 3 jours a la temperature ambiante. On chasse 
la pyridine sous pression reHuite. On reprend dans I'eau, 
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filtre, concentre et obtient un produit que I'on purifie par 
chromatographie. On obtient ainsi le produit recherche, 
rf = 0,12 eluant CH2CI2, MeOH, H2O (60-35-6). 
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Texte libre de la liste de sequences 

SEQ ID NO: 1: 

/function= "implique dans la biosynthese du mycarose" 
5 /gene= "eryBII" 

/function= "implique dans la biosynthese de la desosaraine" 
/gene= "eryCII" 

SEQ ID NO: 4 : 

10 /func1:ion= "implique dans la biosynthese de la desosamine" 
/gene= "eryCIII" 

/note= "SEQ ID NO 1 DE 1046 A 2308" 
SEQ ID NO: 6: 

15 /function= "implique dans la biosynthese du mycarose" 
/gene= "eryBIV" 

/transl_except= (pos: 242 • 244, aa: Met) 
/function= "implique dans la biosynthese du mycarose" 
/gene= "eryBV" 
20 /transl_except= (pos: 1210 .. 1212, aa: Met) 

/function= "implique dans la biosynthese de la desosamine" 
/gene= "eryCVI" 

/function= "implique dans la biosynthese du mycarose" 
/gene= "eryBVI" 
25 / trans l_except= (pos: 3308 3310, aa: Met) . 

/function= "implique dans la biosynthese de la desosamine" 
/gene= "eryCV" 

/functi6n= "implique dans la biosynthese du mycarose" 
/gene= "eryBVI I" 
30 / trans l_except= (pos: 7578 7580, aa: Met) 

SEQ ID NO: 13: 

/function^ "implique dans la biosynthese de la desosamine" 
/gene= "eryCIV" 
35 /note= "SEQ ID NO 6 DE 4837 A 6039" 

SEQ ID NO: 15: 
/gene= "olePl" 
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/function= "glycosylation de 8 , 8a-desoxyoleandolide" 
/gene= "oleGl" 

/ trans l_except= (pos: 1437 1439, aa: Met) 
/function= "glycosylation de 8 , 8a-desoxyoleandolide" 
5 /gene= "oleG2" 
/gene= "oleY" 

SEQ ID NO: 20: 
/gene= "oleM" 
10 /note= "SEQ ID NO 15 DE 3992 A 4729" 

SEQ ID NO: 22 a SEQ ID NO: 60 
/desc = "OLIGONUCLEOTIDE" 



15 SEQ ID NO: 61: 

/note= "SEQ ID NO 11 DE 38 A 50" 
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REVENDICATIONS 

1) Sequence d'ADN simple ou double brin isolee, representee a 
la figure 2 (sequence directe ou complementaire de SEQ ID 

N*" 1) correspondant a la region eryG-ezyAIII du cluster de 
5 genes de la biosynthese de 1 ' erythromycine . 

2) Sequence d'ADN selon la revendication 1 comprenant : 

- la sequence eryBll correspondant a 1'0RF7 (sequence comple- 
mentaire de SEQ ID N° 1 du nucleotide 48 au nucleotide 1046) 
et codant pour une dTDP-4-ceto-L-6-desoxyhexose 

10 2, 3 -reductase, 

- la sequence eryCIII correspondant a I'ORFS (sequence 
complementaire de SEQ ID N° 1 du nucleotide 104 6 au nucleo- 
tide 23 08) et codant pour une desosaminyltransf erase et 

- la sequence eryCII correspondant a 1'0RF9 (sequence comple- 
15 mentaire de SEQ ID N° 1 du nucleotide 2322 au nucleotide 

3404) et codant pour une dTDP-4 -ceto-D- 6 -desoxyhexose 
3 , 4 - isomerase . 

3) Sequence d'ADN isolee representee a la figure 2 choisie 
parmi la sequence eryBII correspondant a l'ORF7 (sequence 

20 complementaire de SEQ ID N° 1 du nucleotide 48 au nucleotide 
1046), la sequence eryCIII correspondant a I'ORFS (sequence 
complementaire de SEQ ID N° 1 du nucleotide 104 6 au nucleo- 
tide 23 08) ou la sequence eryCII correspondant a I'ORFS 
(sequence complementaire de SEQ ID 1 du nucleotide 2322 au 

25 nucleotide 3404) et les sequences qui hybrident et/ou 

presentent des homologies signif icatives avec cette sequence 
ou des fragments de celle-ci et ayant la meme fonction. 

4) Sequence d'ADN isolee eryCIII representee a la figure 2 
correspondant a l'ORF8 (sequence complementaire de SEQ ID 

30 N° 1 du nucleotide 1046 au nucleotide 2308 = sequence compJ..e£_-^ 
mentaire de SEQ ID N° 4) et codant pour une desosaminyl 
transferase . 

5) Polypeptide code par I'une des sequences d'ADN selon I'une 
des revendications 1 a 4. 

3 5 6) Polypeptide selon la revendication 5 correspondant a une 
ORF representee a la figure 2, choisie parmi 1'0RF7 (ayant la 
sequence de SEQ ID N° 2), I'ORFS (ayant la sequence de SEQ ID 
N^ 5) ou I'ORFS (ayant la sequence de SEQ ID N° 3) et les 
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analogues de ce polypeptide, 

7) Polypeptide selon la revendication 5 correspdndant a 
I'ORFS representee a la figure 2 (ayant la sequence de SEQ ID 
N° 5) et ayant une activite desosaminyltransf erase ^ denommee 

5 EryCIII. 

8) Sequence d'ADN isolee representee a la figure 3 (sequence 
de SEQ ID N*=* 6) correspondant a la region eryAl-eryK du 
cluster de genes de la biosynthese de 1 ' erythroraycine . 

9) Sequence d'ADN selon la revendication 8 comprenant : 

10 - la sequence eryBIV correspondant a 1'0RF13 (sequence de SEQ 
ID N*^ 6 du nucleotide 242 au nucleotide 1207) et codant pour 
une dTDP-4-ceto-L-6-desoxyhexose 4 -reductase , 

- la sequence eryBV correspondant a l'ORF14 (sequence de SEQ 
ID 6 du nucleotide 1210 au nucleotide 2454) et codant pour 

15 une mycarosyl transferase, 

- la sequence eryCVI correspondant a l'ORF15 (sequence de SEQ 
ID 6 du nucleotide 2510 au nucleotide 3220) et codant pour 
une dTDP-D-6-desoxyhexose 3 -N-methyltransf erase , 

- la sequence eryBVI correspondant a I'ORFIG (sequence de SEQ 
20 ID N° 6 du nucleotide 3308 au nucleotide 4837) et codant pour 

une dTDP-4-ceto-L-6-desoxyhexose 2 , 3 -deshydratase , 

- la sequence eryCIV correspondant a l'ORF17 (sequence de SEQ 
ID 6 du nucleotide 483 7 au nucleotide 603 9) et codant pour 
une dTDP-D-6-desoxyhexose 3 , 4 -deshydratase , 

25 - la sequence eryCV correspondant a I'ORFIS (sequence de SEQ 
ID N*^ 6 du nucleotide 6080 au nucleotide 7546) et codant pour 
une dTDP-D-4 , 6-didesoxyhexose 3 , 4 -reductase et 

- la sequence eryBVII correspondant a l'ORF19. (sequence de 
SEQ ID N*^ 6 du nucleotide 7578 au nucleotide 8156) et codant 

30 pour une dTDP-4-ceto-D-6-desoxyhexose 3,5 epimerase, _ 

10) Sequence d'ADN isolee representee a la figure 3 choisie 
parmi la sequence eryBIV correspondant a 1'0RF13 (sequence de 
SEQ ID N° 6 du nucleotide 242 au nucleotide 12 07) , la 
sequence eryBV correspondant a 1'0RF14 (sequence de SEQ ID 

35 N° 6 du nucleotide 1210 au nucleotide 2454) , la sequence 
eryCVI correspondant a l'ORF15 (sequence de SEQ ID N° 6 du 
nucleotide 2510 au nucleotide 3220) , la sequence eryBVI 
correspondant a l'ORF16 (sequence de SEQ ID N° 6 du nucleo- 
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tide 3308 au nucleotide 4837) , la sequence eryCIV correspon- 
dant a 1'0RF17 (sequence de SEQ ID N° 6 du nucleotide 4837 au 
nucleotide 6039), la sequence eryCV correspondant a 1'0RF18 
(sequence de SEQ ID 6 du nucleotide 6080 au nucleotide 
5 7546) ou la sequence eryBVII correspondant a l'ORF19 

(sequence de SEQ ID N*' 6 du nucleotide 7578 au nucleotide 
8156) et les sequences qui hybrident et/ou presentent des 
homologies signif icatives avec cette sequence ou des 
fragments de celle-ci et ayant la meme fonction. 
10 11) Sequence d'ADN isolee eryBV representee a la figure 3 
correspondant a l'ORF14 (sequence de SEQ ID 6 du nucleo- 
tide 1210 au nucleotide 2454) et codant pour une mycarosyl- 
transf erase . 

12) Polypeptide code par 1 ' une des sequences d'ADN selon 
15 I'une des revendications 8 a 11 . 

13) Polypeptide selon la revendication 12 correspondant a une 
ORF representee a la figure 3, choisie parmi l'ORF13 (ayant 
la sequence de SEQ ID N° 1), 1'0RF14 (ayant la sequence de 
SEQ ID N*' 8), 1/ORF15 (ayant la sequence de SEQ . ID N° 9), 

20 1'0RF16 (ayant la sequence de SEQ ID N*' 10), 1'0RF17 (ayant 
la sequence de SEQ ID N° 14) , I'ORFIS (ayant la sequence de 
SEQ ID N*=' 11) ou l'ORF19 (ayant la sequence de SEQ ID N° 12) 
et les analogues de ce peptide, 

14) Polypeptide selon la revendication 12 correspondant a 
25 l'ORF14 representee a la figure 3 (ayant la sequence de SEQ 

ID N° 8) et -ayant une activite mycarosyltransf erase , denomme 
EryBV . 

15) Utilisation d'au moins I'une des sequences d'ADN choisie 
parmi les sequences eryBII (sequence complementaire de SEQ ID 

30 N*=* 1 du nucleotide 48 au nucleotide 1046) , er><:ill (sequenqe_ 
complementaire de SEQ ID 1 du nucleotide 1046 au nucleo- 
tide 2308) ou eryCII (sequence complementaire de SEQ ID 1 
du nucleotide 2322 au nucleotide 3404) representees a la 
figure 2, eryBIV (sequence de SEQ ID N° 6 du nucleotide 242 

35 au nucleotide 1207), eryBV (sequence de SEQ ID N*=» 6 du 

nucleotide 1210 au nucleotide 2454) , eryCVI (sequence de SEQ 
ID N*' 6 du nucleotide 2510 au nucleotide 3220) , eryBVI 
(sequence de SEQ ID 6 du nucleotide 3308 au nucleotide 
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4837) , eryClV (sequence de SEQ ID N° 6 du nucleotide 4837 au 
nucleotide 6039) , eryCV (sequence de SEQ ID N° 6 du nucleo- 
tide 6 08 0 au nucleotide 754 6) ou eryBVII (sequence de SEQ ID 
6 du nucleotide 7578 au nucleotide 8156) representee a la 
5 figure 3, pour synthetiser des metabolites secondaires 
hybrides chez Sac. erythra^ea. 

16) Utilisation d'au moins I'une des sequences d'ADN choisie 
parmi les sequences eryBII (sequence complementaire de SEQ ID 

1 du nucleotide 48 au nucleotide 1046), eryCIII (sequence 
10 complementaire de SEQ ID N° 1 du nucleotide 1046 au nucleo- 
tide 23 08) ou eryCII (sequence complementaire de SEQ ID 1 
du nucleotide 2322 au nucleotide 3404) representees a la 
figure 2, eryBIV (sequence de SEQ ID N° 6 du nucleotide 24 2 
au nucleotide 12 07) , eryBV (sequence de SEQ ID N° 6 du 
15 nucleotide 1210 au nucleotide 2454) , eryCVI (sequence de SEQ 
ID N° 6 du nucleotide 2510 au nucleotide 3220) , eryBVI 
(sequence de SEQ ID N° 6 du nucleotide 3308 au nucleotide 
4837) , eryCIV (sequence de SEQ ID N° 6 du nucleotide 4837 au 
nucleotide 6 039) , eryCV (sequence de SEQ ID N*=^ 6 du nucleo- 
20 tide 6080 au nucleotide 7546) ou eryBVII (sequence de SEQ ID 
N° 6 du nucleotide 7578 au nucleotide 8156) representee a la 
figure 3 ou d'un fragment de cette sequence, comme sondes 
d' hybridation . 

17) Utilisation de la sequence d'ADN eryClU representee a la 
25 figure 2 (sequence complementaire de SEQ ID 1 du nucleo- 
tide 1046 au nucleotide 2308 = sequence complementaire de SEQ 
ID N° 4) comme sonde d' hybridation pour isoler des genes 
homologues responsables de la glycosylation de la 
macrolactone chez une souche productrice de macrolide. 

30 18) Utilisation selon la revendication 17 dans laquelle les. . 

genes homologues sont les genes de la biosynthese de 
1 ' oleandomycine chez S. antiJbioticus . 

19) Sequence d'ADN isolee representee a la figure 22 
(sequence de SEQ ID N° 15) correspondant a une region du 
3 5 cluster de genes de la biosynthese de 1 ' oleandomycine 
comprenant : 

- la sequence correspondant a I'ORF olePl du nucleotide 184 
au nucleotide 13 86, 
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- la sequence correspondant a I'ORF oleGl du nucleotide 1437 
au nucleotide 2714 codant pour une activite glycosyltrans- 

f erase , 

- la sequence correspondant a I'ORF oieG2 du nucleotide 2722 
5 au nucleotide 3 999 codant pour une activite glycosyltrans- 

f erase, 

- la sequence correspondant a I'ORF oleM du nucleotide 3 9 92 
au nucleotide 4720 (= sequence de SEQ ID N° 20) et 

- la sequence correspondant a I'ORF oleY du nucleotide 4810 
10 au nucleotide 5967. 

20) Sequence d'ADN isolee representee a la figure 22 choisie 
parmi la sequence correspondant a I'ORF oleGl (sequence de 
SEQ ID N*^ 15 du nucleotide 143 7 au nucleotide 2714 codant 
pour une activite glycosyltransf erase et la sequence 

15 correspondant a I'ORF, oIeG2 (sequence de SEQ ID N*^ 15 du 

nucleotide 2722 au nucleotide 3 999) codant pour une activite 
glycosyltransf erase . 

21) Sequence d'ADN isolee selon la revendication 20 corres- 
pondant a I'ORF oleGl (sequence de SEQ ID N° 15 du nucleotide 

20 1437 au nucleotide 2714) codant pour une activite desosa- 
minyltransf erase . 

22) Sequence d'ADN isolee selon la revendication 20 
correspondant a I'ORF ol eG2 (sequence de SEQ ID N*^ 15 du 
nucleotide 2722 au nucleotide 3 999) codant pour une activite 

25 oleandrosyltransf erase . 

23) Polypeptide code par la sequence d'ADN correspondant a 
I'ORF oleGl et ayant une activite desosaminyltransf erase 
(sequence de SEQ ID N*^ 17) . 

24) Polypeptide code par la sequence d'ADN correspondant a 

30 I'ORF oleG2 et ayant une activite oleandrosyltransf erase — _ 
(sequence de SEQ ID N° 18) . 

25) Procede de preparation de metabolites secondaires 
hybrides chez Sac. erythraea. dans lequel : 

- on isole une sequence ADN contenant au moins une sequence 
35 eryB ou une sequence eryC du cluster de genes de la bio- 
synthese de 1 ' erythromycine representee a la figure 2 

(sequence complementaire de SEQ ID N*' 1) oii a la figure 3 

(sequence de SEQ ID N^ 6) , 
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- on cree une modification dans la dite sequence et on. 
obtient une sequence alteree, 

- on integre la sequence alteree dans le chromosome de la 
souche hote et on obtient une souche modifiee, 

5 - on cultive la souche modifiee dans des conditions permet- 
tant la formation du metabolite secondaire hybride et 

- on isole le metabolite secondaire hybride. 

26) Precede selon la revendication 25 dans lequel la sequence 
ADN code pour I'une des enzymes choisie parmi une 
10 - dTDP-4 -ceto-L-6-desoxyhexose 2 , 3 -reductase , 

- desosaminyltransf erase, 

- dTDP-4 -ceto-D-6-desoxyhexose 3 , 4-isomerase, 

- dTDP-4 -ceto-L- 6 -desoxyhexose 4 -reductase , 

- mycarosyltransf erase , 

15 - dTDP-D- 6 -desoxyhexose 3 -N-methyltransf erase , 

- dTDP-4 -ceto-L- 6 -desoxyhexose 2 , 3 -deshydratase , 

- dTDP-D- 6 -desoxyhexose 3 , 4 -deshydratase , 

- dTDP-D-4 , 6-didesoxyhexose 3 , 4 -reductase ou 

- dTDP-4 -ceto-D-6-desoxyhexose 3,5 epimerase . 

20 27) Precede selon la revendication 25 dans lequel 1' altera- 
tion de la sequence resulte dans 1 ' inactivation d'au moins 
I'une des enzymes choisie parmi une. 

- dTDP-4-ceto-L-6-desoxyhexose 2 , 3 -reductase , 

- desosaminyltransf erase , 

25 - dTDP-4 -ceto-D-6 -desoxyhexose 3 , 4 -isomerase , 

- dTDP-4 -ceto-L- 6 -desoxyhexose 4 -reductase, 

- mycarosyltransf erase , 

- dTDP-D- 6 -desoxyhexose 3 -N-methyltransf erase , 

- dTDP'^4 -ceto-L- 6 -desoxyhexose 2 , 3 -deshydratase , 

3 0 - dTDP-D- 6 -desoxyhexose 3 , 4-deshydratase , ^ 

- dTDP-D-4 , 6-didesoxyhexose 3 , 4 -reductase ou 

- dTDP-4 -ceto-D-6 -desoxyhexose 3,5 epimerase. 

28) Precede selon la revendication 27 dans lequel 1' enzyme 
inactivee est une dTDP-4 -ceto-L- 6 -desoxyhexose 4 -reductase, 
35 29) Precede selon la revendication 27 dans lequel 1' enzyme 
inactivee est une dTDP-D- 6 -desoxyhexose 3 , 4 -deshydratase . 
30) Precede selon la revendication 27 dans lequel 1' enzyme 
inactivee est une mycarosyltransf erase . 
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31) Precede selon la revendication 27 dans lequel 1' enzyme 
inactivee est une dTDP-4-ceto-L-6-desoxyhexose 2 , 3-reductase . 

32) Precede selon la revendication 25 dans lequel le 
metabolite secondaire hybride isole est un analogue de 

5 I'erythromycine choisi parmi la 4 " -ceto-erythromycine , la 
4' -hydroxy -erythr omy cine ou la 3 " -C-desmethyl-2 " , 3 " -ene- 
erythromycine . 

33) Precede selon la revendication 25 dans lequel le 
metabolite secondaire hybride isole est le desosaminyl 

10 erythronolide B.' 

34) Souche de Sac. erythraea modifiee dans laquelle au moins 
I'une des enzymes choisie parmi une 

- dTDP-4-ceto-L-6-desoxyhexose 2 , 3 -reductase , 

- desosaminyl transferase , 

15 - dTDP-4 -ceto-D-6-desoxyhexose 3 , 4 -isomerase , 

- dTDP-4-ceto-L-6-desoxyhexose 4 -reductase, 

- mycarosyltransf erase / 

- dTDP-D-6-desoxyhexose 3 -N-methyltransf erase , 

- dTDP-4 -ceto-L-6-desoxyhexose 2 , 3 -deshydratase , 
20 - dTDP-D-6-desoxyhexose 3 , 4 -deshydratase , 

- dTDP-D-4 , 6-didesoxyhexose 3 , 4 -reductase ou 

- dTDP-4 -ceto-D- 6 -desoxyhexose 3,5 epimerase 

est inactivee et produisant au moins un metabolite secondaire 
hybride . 

25 35) Souche de Sac. erythraea modifiee (BII92) dans laquelle 
une dTDP-4-ceto-L-6-desoxyhexose 2 , 3 -reductase est inactivee 
et produisant la 3 " -C-desmethyl-2 " , 3 " -ene-erythromycine C. 

36) Souche de Sac. erythraea modifiee (BIV87) dans laquelle 
une dTDP-4-ceto-L-6-desoxyhexose 4-reductase est inactivee et 

3 0 produisant la 4 " -ceto-erythromycine . ...^ — 

37) Souche de Sac. erythraea modifiee (CIV89) dans laquelle 
une dTDP-D- 6 -desoxyhexose 3 , 4 -deshydratase est inactivee et 
produisant la 4 ' -hydroxyerythromycine D. 

38) Souche de Sac, erythraea modifiee (BV88) dans laquelle 
3 5 une mycarosyltransf erase est inactivee et produisant du 

desoaminyl erythronolide B, 

39) Precede de preparation de precurseurs de 1 ' oleandomycine 
chez S. antibioticus dans lequel 
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- on cree une alteration de la sequence du gene choisie parmi 
la sequence d'ADN correspondant a I'ORF oleGl (sequence de 
SEQ ID N° 15 du nucleotide 1437 au nucleotide 2714) 

et la sequence d'ADN correspondant a I'ORF oIeG2 (sequence 
5 de SEQ ID N° 15 du nucleotide 2722 au nucleotide 3999) dans 
le chromosome d'une souche hote et obtient une souche 
modif iee, 

- on cultive la souche modifiee dans des conditions 
permettant 1 ' accumulation des precurseurs de 1 ' oleandomycine 

10 et 

- on isole ces precurseurs. 

40) Procede selon la revendication 3 9 dans lequel 1' altera- 
tion est creee dans la sequence d'ADN correspondant a I'ORF 
oleGl (sequence de SEQ ID N° 15 du nucleotide 1437 au 

15 nucleotide 2714) et dont il resulte au moins 1 ' elimination de 
I'activite desoaminyltransf erase et 1 ' accumulation du 
precurseur de 1 ' oleandomycine 8 , 8a-desoxyoleandolide . 

41) Thymidine 5 ' - ( trihydrogene diphosphate) ,P'-[3,4,6- 
tridesoxy-3- (dimethylamino) -D- . xylo . -hexopyranosyl] ester 

20 (dTDP-D-desosamine) et les sels d' addition avec les bases. 
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43610 43630 43650 

TTTGACAGGTCCGCCACGCGTCCCCCTACTCGACGACCACGCAATGGGCGAACAATATAG 

43670 43690 43710 

GAAGGATCAAGAGGTTGACATCGCCTCGTCGAGCCAACGAACCTGTGAACATCTGCATGT 

43730 43750 43770 

TGACAAGATCAACGGCGGCTACCTACTGTGGTGGCCCAGTGACGGGTTGCCGCACATCGC 

43790 43810 43830 

GCTGGGGAGATTCTTTGAATTTCGCCCGTAGCACCGACCTGGAAAGCGAGCAAATGCTCC 

43850 43870 43890 . 

GGTGAATGGGATCAGTGATTCCCCGCGTCAATTGATCACCCTTCTGGGCGCTTCCGGCTT 
VNG ISDSPRQLITLLGASGF 

ORF13 — > ..n^n 

43910 43930 43950 

CGTCGGGAGCGCGGTTCTGCGCGAGCTGCGCGACCACCCGGTCCGGCTGCGCGCGGTGTC 
VGSAVLRELRDHPVRLRAVS 

43970 43990 44010 

CCGCGGCGGAGCGCCCGCGGTTCCGCCCGGCGCCGCGGAGGTCGAGGACCTGCGCGCCGA 
RGGAPAVPPGAAEVEDLRAD 

44030 44050 44070 

CCTGCTGGA-ACCGGGCCGGGCCGCCGCCGCGATCGAGGACGCCGACGTGATCGTGCACCT 

LLEPGRAAAAI EDADVIVHL 
44090 44110 44130 

GGTGGCGCACGCAGCGGGCGGTTCCACCTGGCGCAGCGCCACCTCCGACCCGGAAGCCGA 
VAHAAGGSTWRSATSDPEAE 

44150 44170 44190 

GCGGGTCAACGTCGGCCTGATGCACGACCTCGTCGGCGCGCTGCACGATCGCCGCAGGTC 
RVNVGLMHDLVGALHDRRRS 

44210 44230 44250 

GACGCCGCCCGTGTTGCTCTACGCGAGCACCGCACAGGCCGCG.i'J^CCCGTCGGCGGCCAG 
TPPVLLYASTAQAANPSAAS 

44270 44290 44310 

CAGGTACGCGCAGCAGAAGACCGAGGCCGAGCGCATCCTGCGCAAAGCCACCGACGAGGG 

RYAQQ KTEAERI LRKATDEG 
44330 44350 44370 

CCGGGTGCGCGGCGTGATCCTGCGGCTGCCCGCCGTCTACGGCCAGAGCGGCCCGTCCGG 
RVRGVILRLPAVYGQSGPSG 

44390 44410 44430 

CCCCATGGGGCGGGGCGTGGTCGCAGCGATGATCCGGCGTGCCCTCGCCGGCGAGCCGCT 
PMGRGVVAAMIRRALAGEPL 

44450 44470 44490 

CACCATGTGGCACGACGGCGGCGTGCGCCGCGACCTGCTGCACGTC.GAGGACGTGGCCAC 
TMWHDGGVRRDLLHVEDVAT 

44510 44530 44550 

CGCGTTCGCCGCCGCGCTGGAGCACCACGACGCGCTGGCCGGCGGCACGTGGGCGCTGGG^ 
AFAAALEHHDALAGGTWALG 

44570 44590 44610 

CGCCGACCGATCCGAGCCGCTCGGCGACATCTTCCGGGCCGTCTCCGGCAGCGTCGCCCG 
ADRSEPLGDIFRAVSGSVAR 

44630 44650 44670 

GCAGACCGGCAGCCCCGCCGTCGACGTGGTCACCGTGCCCGCGCCCGAGCACGCCGAGGC 
QTGSPAV DVVTVPAPEHAEA 
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44690 44710 44730 

CAACGACTTCCGCAGCGACGACATCGACTCCACCGAGTTCCGCAGCCGGACCGGCTGGCG 

F RSDDIDSTEFRS R T G W R 
44750 44770 44790 

■ CCCCCGGGTTTCCCTCACCGACGGCA'TCGACCGGACGGTGGCCGCCCTGACCCCCACCGA 
P R V SLTDGIDRTVAALTPTE 

44810 44830 44850 

GGAGCACTAGTGCGGGTACTCCTCACGTCCTTCGCGCACCGCACGCACTTCCAGGGACTG 

^^*VRVLLTSFAHRTH F QGL 
ORF14 > 

44870 44890 44910 

GTCCCGCTGGCGTGGGCGCTGCGCACCGCGGGTCACGACGTGCGCGTGGCCGCCCAGCCC 

VPLAWA L RTAGHDVRVAAQP 

44930 44950 44970 

GCGCTCACCGACGCGGTCATCGGCGCCGGTCTCACCGCGGTACCCGTCGGCTCCGACCAC 

ALTDAVIGAGLTAVPVGSDH 

^ ^4990 45010 45030 

CGGCTCTTCGACATCGTCCCGGAAGTCGCCGCTCAGGTGCACCGCTACTCCTTCTACCTG 
R LFDIVPEVAAQVHRYSFYL 

^ 45050 45070 45090 

GACTTCTACCACCGCGAGCAGGAGCTGCACTCGTGGGAGTTCCTGCTCGGCATGCAGGAG 

DFYHREQELHSWEFLLGMQE 

45110 45130 45150 

GCCACCTCGCGGTGGGTATACCCGGTGGTCAACAACGACTCCTTCGTCGCCGAGCTGGTC 
ATSRWVYPVVNNDSFVAELV 

^ ^ 45170 45190 45210 

GACTTCGCCCGGGACTCGCGTCCTGACCTGGTGCTCTGGGAGCCGTTCACCTTCGCCGGC 

DFARDWRPDLVLWEP F T F A G 

45230 45250 45270 

GCCGTCGCGGCCCGGGCCTGCGGAGCCGCGCACGCCCGGCTGCTGTGGGGCAGCGACCTC 

AVAARACGA AHARLL W G S D L 

45290 45310 45330 

ACCGGCTACTTCCGCGGCCGGTTCCAGGCGCAACGCCTGCGACGGCCGCCGGAGGACCGG 

TGYFRGRFQAQRLRR P^^^ D R 

45350 45370 45390 

CCGGACCCGCTGGGCACGTGGCTGACCGAGGTCGCGGGGCGCTTCGGCGTCGAATTCGGC 

PDPLGTWLTEVAGRFGVEFG 

45410 45430 ■ 45450 

GAGGACCTCGCGGTCGGGCAGTGGTCGGTCGACCAGTTGCCGCCGAGTTTCCGGCTGGAC 

EDLAVGQWSVDQLPP ^./^^^^ ^ ^ 

4-5470 45490 -.45510 

ACCGGAATGGAAACCGTTGTCGCGCGGACCCrcCCCTACAACGGCGCGTCGGTGGTTCCG 

TGMETVVARTLPYNG A S V V P 

45530 45550 45570 

GACTGGCTCAAGAAGGGCAGTCCGACTCGACGCATCTGCATTACCGGAGGGTTCTCCGGA 

DWLKKGSATRRICIT G G F S G 

45590 45610 45630 

CTCGGGCTCGCCGCCGATCCCGATCAGTTCGCGCGGACGCTCGCGCAGCTCGCGCGATTC 

LGLAA D ADQFARTLA Q L A R F 

45650 45670 45690 

GATGGCGAAATCGTGGTTACGGGTTCCGGTCCGGATACCTCCGCGGTACCGGACAACATT 

nCEIVVTGSGPDTSAVPDNI 
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45710 45730 45750 

CGTTTGGTGGATTTCGTTCCGATGGGCGTTCTGCTCCAGAACTGCGCGGCGATCATCCAC 

RL VDFVPMGVLLQNCAAI IH 

45770 45790 45810 

CACGGCGGGGCCGGAACCTGGGCCACGGCACTGCACCACGGAATTCCGCAAATATCAGTT 
HGGAGTWATALHHGIPQIS. V 

45830 45850 45870 

GCACATGAATGGGATTGCATGCTACGCGGCCAGCAGACCGCGGAACTGGGCGCGGGAATC 
AHEWDC.MLRGQQTAELGAGI 

45890 45910 45930 

TACCTCCGGCCGGACGAGGTCGATGCCGACTCATTGGCGAGCGCCCTCACCCAGGTGGTC 
YLRPDEVDADSLASALTQVV 

45950 45970 45990 

GAGGACCCCACCTACACCGAGAACGCGGTGAAGCTTCGCGAGGAGGCGCTGTCCGACCCG 
EDPTYT-ENAVKLREEALSDP 

46010 46030 46050 

ACGCCGCAGGAGATCGTCCCGCGACTGGAGGAACTCACGCGCCGCCACGCCGGCTAGCGG 

TPQEI VPRLEELTRRHAG* 

46070 46090 46110 

TTTCCGACCGACAAGTCCGTCCGACAGCACACCTCCGGAGGGAGCAGGGATGTACGAGGG 

M Y E G 
0RF15 > 

46130 46150 46170 

CGGGTTCGCCGAGCTTTACGACCGGTTCTACCGCGGCCGGGGCAAGGACTACGCGGCCGA 
GFAELYDRFYRGRGKDYAAE 

46190 46210 46230 

GGCCGCGCAGGTCGCGCGGCTGGTCAGAGACCGCCTGCCCTCGGCTTCCTCGCTGCTCGA 
AAQVARLVRDRLPSASSLLD 

46250 46270 46290 

CGTGGCCTGCGGGACCGGCACCCACCTGCGCCGGTTCGCCGACCTCTTCGACGACGTGAC 
VACGTGTHLRRFADLFDDVT 

46310 46330 46350 

CGGGCTGGAGCTGTCGGCGGCGATGATCGAGGTCGCCCGGCCGCAGCTCGGCGGCATCCC 

GLELSAAMIEVARPQLGGIP 

46370 46390 46410 

GGTGCTGCAGGGCGACATGCGCGACTTCGCGCTGGATCGCGAGTTCGACGCCGTCACCTG 
VLQGDMRDFALDREFDAVTC 

46430 46450 46470 

CATGTTCAGCTCCATCGGGCACATGCGCGACGGCGCCGAGCTGGAeCAGGCGCTGGCGTC 

MF S S I GHMRDGA E LDQALAS 
46490 46510 46530 

CTTCGCCCGCCACCTCGCCCCCGGCGGCGTCGTGGTGGTCGAACCGTGGTGGTTCCCGGA 
FA-RHLAPGGVVVVEP.WWFPE 

46550 46570 46590 

GGACTTCCTCGACGGCTACGTGGCCGGTGACGTGGTGCGCGACGGCGACCTGACGATCTG^--^ 
DFLDGYVAGDVVRD.GDLTI S 

46610 46630 46650 

GCGCGTCTCGCACTCCGTGCGCGCCGGCGGCGCGACCCGGATGGAGATCCACTGGGTCGT 
RVSHSVRAGGATRMEIHWVV 

46670 46690 46710 

• GGCCGACGCGGTGAACGGTCCGCGGCACCACGTGGAGCACTACGAGATCACGCTCTTCGA 
ADAVNGPRHHVEHYEITLFE 
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46730 46750 46770 

GCGGCAGCAGTACGAGAAGGCCTTCACCGCGGCCGGTTGCGCTGTGCAGTACCTGGAGGG 
RQQYEKAFTAAGCAVQYLEG 

46790 46810 46830 

CGGACCCTCCGGACGCGGGTTGTTCGTCGGTGTGCGCGGATGACCCGTGCGTTCGCGTTT 

GPSGRGLFVGVRG* 

46850 46870 46890 

TCCGTTCCTGGCACAGGTGATCCGCTCCACGGGCCCTTTCCCCGCCGTGACCGGACCCTT 

46910 46930 46950 

ACAGTGAGTGCGGGTCTTGATCGACAACGCCCGGCGGCAGCAAGCGGAGCCGTCGACGAC 
VRVLIDNARRQQAEPSTT 

0RF16 > 

46970 46990 47010 

ACCGCAGGGAGAGTCGATGGGTGATCGGACCGGCGACCGGACGATTCCGGAATCCTCGCA 

PQGESM GDRTGDRTI PESSQ 

47030 47050 47070 

GACCGCAACGCGTTTCCTGCTCGGCGACGGCGGAATCCCCACCGCCACGGCGGAAACCCA 

TATRFLLGDGGI PTATAETH 
47090 47110 47130 

CGACTGGCTGACCGGCAACGGCGCCGAGCAGCGGCTCGAGGTGGCGCGCGTGCCGTTCAG 
DWLTRNGAEQRLEVARVPFS 

47150 47170 47190 

CGCCATGGACCGCTGGTCGTTCCAGCCCGAGGACGGCAGGCTCGCCCACGAGTCCGGGCG 
AMDRWSFQPEDGRLAHESGR 

47210 47230 47250 

CTTCTTCTCCATCGAGGGCCTGCACGTGCGGACGAACTTCGGCTGGCGGCGGGACTGGAT 
FFS lEGLKVRTNFGWRRDWI 
47270 47290 47310 

CCAGCCCATCATCGTGCAGCCCGAGATCGGCnCCTCGGCCTCATCGTCAAGGAGTTCGA 
QPIIVQPEIGFLGLIVKEFD 

47330 47350 47370 

CGGTGTGCTGCACGTGCTGGCGCAGGCCAAGGCCGAGCCGGGCAACATCAACGCCGTCCA 
GVLHVLAQAKAEPGNINAVQ 

47390 47410 47430 

GCTCTCCCCGACCCTGCAGGCGACCCGCAGCAACTACACCGGCGTCCACCGCGGCTCGAA 
LSPTLQATRSNYTGVHRGSK 

Z17450 47470 47490 

GGTCCGGTTCATCGAGTACTTCAACGGCACGCGCCCGAGCCGGATCCTCGTCGACGTGCT 
VRF lEYFNGTRPSRI.LVDVL 
47510 47530 47550 

CCAGTCCGAGCAGGGCGCGTGGTTCCTGCGCAAGCGCAACCGGAACATGGTCGTCGAGGT 
QSEQGAWFLRKRNRNMVVEV 

47570 47590 47610 

GTTCGACGACCTGCCCGAGCACCCGAACTTCCGGTGGCTGACCGTCGCGCAGCTGCGGGC 
FDDLPEHPNFRWLTV AQLRA -^::z:z'J: 
47630 47650 47670 

GATGCTGCACCACGACAACGTGGTGAACATGGACCTGCGCACCGTGCTGGCCTGCGTCCC 
MLHHDNVV NMDLRTVLACVP 

47690 47710 47730 

GACCGCCGTGGAGCGGGACCGGGCCGACGACGTGCTCGCGCGCCTGCCCGAGGGCTCGTT 

•taverdraddvlarl PEG SF 
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47750 47770 47790 

CCAGGCCCGGCTGCTGCACTCGTTCATCGGCGCGGGCACCCCGGCCAACAACATGAACAG 
QARLLHSFIGAGTPANNMNS 

47810 47830 47850 

CCTGCTGAGCTGGATCTCCGACGTGCGCGCCAGGCGCGAGTTCGTGCAGCGCGGCCGCCC 
LLSWI SDVRARREFVQRGRP 
47870 47890 47910 

GCTGCCCGACATCGAGCGCAGCGGGTGGATCCGCCGCGACGACGGCATCGAGCACGAGGA 
LPDIERSGWIRRDDGI EKEE 

■47930 47950 47970 

GAAGAAGTACTTCGACGTCTTCGGCGTCACGGTGGCGACCAGCGACCGCGAGGTCAACTC 
KKYFD VFGVTVAT SDREVNS 

47990 48010 48030 

GTGGATGCAGCCGCTGCTCTCGCCCGCCAACAACGGCCTGCTCGCCCTGCTGGTCAAGGA 
WMQPLL S PANNGLLALLVKD 
48050 48070 48090 

CATCGGCGGCACGTtGCACGCGCTCGTGCAGCTGCGCACCGAGGCGGGCGGGATGGACGT 
IGGTLHALVQLRTEAGGMDV 
48110 48130 48150 

CGCCGAGCTGGCGCCTACGGTGCACTGCCAGCCCGACAACTACGCCGACGCGCCCGAGGA 
AELAPTVHCQPDNYADAPEE 

48170 48190 48210 

GTTCCGACCGGCCTATGTGGACTACGTGTTGAACGTGCCGCGCTCGCAGGTCCGCTACGA 
FRPAYVDYVLNVPRSQV RYD 

48230 48250 48270 

CGCATGGCACTCCGAGGAGGGCGGCCGGTTCTACCGCAACGAGAACCGGTACATGCTGAT 
AWHSEEGGRFYRNENRYMLI. 

48290 48310 48330 

CGAGGTGCCCGCCGACTTCGACGCCAGTGCCGCTCCCGACCACCGGTGGATGACCTTCGA 
EVPADFDASAAPDHRWM TFD 

48350 48370 48390 

CCAGATCACCTACCTGCTCGGGCACAGCCACTACGTCAACATCCAGCTGCGCAGCATCAT 
QITYLLGHSHYVNIQLRSII 
48410 48430 48450 

CGCGTGCGCCTCGGCCGTCTACACCAGGACCGCCGGATGAAACGCGCGCTGACCGACCTG 

ACASAVYTRTAG* 

MKRALTDL 
ORF17 > 

48470 48490 -48510 

GCGATCTTCGGCGGCCCCGAGGCATTCCTGCACACCCTCTACGTGGGCAGGCCGACCGTC 
AIFGGPEAFLHTLYVGRPTV 

48530 48550 48570 

GGGGACCGGGAGCGGTTCTTCGCCCGCCTGGAGTGGGCGCTGAACAACAACTGGCTGACC 
GDRERFFARLEWALNNNWLT 

48590 48610 48630 

AACGGCGGACCACTGGTGCGCGAGTTCGAGGGCCGGGTCGCCGACCTGGCGGGTGTCCGC 
NGGPLVREFEGRVADLAGVR 

48650 48670 48690 

CACTGCGTGGCCACCTGCAACGCGACGGTCGCGCTGCAACTGGTGCTGCGCGCGAGCGAC 
HCVATCNATVALQLVLRASD 

48710 48730 48750 

GTGTCCGGCGAGGTCGTCATGCCTTCGATGACGTTCGCGGCCACCGCGCACGCGGCGAGC 
VSGEVVMPoSMTFAATAHAAS 
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48770 48790 48810 

TGGCTGGGGCTGGAACCGGTGTTCTGCGACGTGGACCCCGAGACCGGCCTGCTCGACCCC 

WLGLEPVFCDVDPETGLLDP 

48830 48850 48870 

GAGCACGTCGCGTCGCTGGTGACACCGCGGACGGGCGCGATCATCGGCGTGCACCTGTGG 

EHVASLVTPRTGAI IGVHLW 

48890 48910 48930 

GGCAGGCCCGCTCCGG'TCGAGGCGCTGGAGAAGATCGCCGCCGAGCACCAGGTCAAACTC 

GR PA PVEALE K I AA EHQVKL 

48950 48970 48990 

TTCTTCGACGCCGCGCACGCGCIGGGCTGCACCGCCGGCGGGCGGCCGGTCGGCGCCTTC 
FFDAAHALGCTAGG RPVGAF 

49010 49030 49050 

GGCAACGCCGAGGTGTTCAGCTTCCACGCCACGAAGGCGGTCACCTCGTTCGAGGGCGGC 
GNAEVF-SFHATKAVTSFEGG 

49070 49090 49110 

GCCATCGTCACCGACGACGGGCTGCTGGCCGACCGCATCCGCGCCATGCACAACTTCGGG 
AIVTDDGLLADRIRAMHNFG 

49130 49150 49170 

ATCGCACCGGACAAGCTGGTGACCGATGTCGGCACCAACGGCAAGATGAGCGAGTGCGCC 
lAPDKLVTDVGTNGK.MSECA 

49190 49210 49230 

GCGGCGATCGGCCTCACCTCGCTCGACGCCTTCGCCGAGACCAGGGTGCACAACCGCCTC 
AAMGLTSLDAFAETRVHNRL 

49250 49270 49290 

AACCACGCGCTCTACTCCGACGAGCTCCGCGACGTGCGCGGCATATCCGTGCACGCGTTC 
NHALYSDELRDVRGISVHAF 

49310 49330 49350 

GATCCTGGCGAGCAGAACAACTACCAGTACGTGATCATCTCGGTGGACTCCGCGGCCACC 

DPGEQNNYQYVI I SVDSAAT 

49370 49390 49410 . 

GGCATCGACCGCGACCAGTTGCAGGCGATCCTGCGAGCGGAG.aAGGTTGTGGCACAACCC 

GIDRDQLQAI LRAEKVVAQP 

49430 49450 49470 

TACTTCTCCCCCGGGTGCCACCAGATGCAGCCGTACCGGACCGAGCCGCCGCTGCGGCTG 
YFSPGCHQMQPYRTEPPLRL 

49490 49510 49530 

GAGAACACCGAACAGCTCTCCGACCGGGTGCTCGCGCTGCCCACCGGCCCCGCGGTGTCC 
ENTEQLSDRVLAL PTGPAVS 

49550 49570 49590 

AGCGAGGACATCCGGCGGGTGTGCGACATCATCCGGCTCGCCGCCACCAGCGGCGAGCTG 
SEClIRRVCDI IRLAAT SGEL 

49610 49630 .49650 

ATCAACGCGCAATGGGACCAGAGGACGCGCAACGGTTCGTGACGACCTGCGCCACAAGTG 

INAQWDQRTRNGS * 

49670 49690 49710 

CCAGGAGGTTCGCTCCCCGATGAACACAACTCGTACGGCAACCGCCCAGGAAGCGGGGGT 

MNTTRT'ATAQEAGV 

0RF18 > 

49730 49750 49770 

• CGCCGACGCGGCGCGCCCGGACGTCGACCGGCGGGCGGTCGTGCGGGCGCTGAGCTCGGA 
ADAARPDVDRRAVVRA L S SE 
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49790 49810 49830 

GGTCTCCCGCGTCACCGGCGCCGGTGACGGTGACGCCGACGTGCAGGCCGCCCGGCTCGC 

VSRVTGAGDGDADVQAARLA 

49850 49870 49890 

CGACCTCGCCGCGCACTACGGGGCGCACCCGTTCACGCCGCTGGAGCAGACGCGTGCGCG 

DLAAHYGAHPFTPLEQTRAR 

49910 49930 49950 

■ GCTCGGCCTGGACCGCGCGGAGTTCGCCCACCTGCTCGACCTGTTCGGCCGCATCCCGGA 
LGLDRAEFAHLLDLFGRIPD 

49970 49990 50010 

CCTGGGCACCGCGGTGGAGCACGGTGCGGCGGGCAAGTACTGGTCCAACACGATCAAGCC 

LGTAVEHG PAGKYWSNTIKP 

50030 50050 50070 

GCTGGACGCCGCAGGCGCACTGGACGCGGCGGTCTACCGCAAGCCTGCCTTCCCCTACAG 
LDAAGALDAAVYRKPAFPYS 

50090 50110 50130 

CGTCGGCCTGTACCCCGGGCCGACGTGCATGTTCCGCTGCCACTTCTGCGTGCGGGTGAC 
VGLYPGPTCMFRCHFCVRVT 

50150 50170 50190 

CGGTCCCCGCTACGAGGCCGCATCGGTCCCGGCGGGCAACGAGACGCTGGCCGCGATCAT 

GARYEAASVPAGNETLAAII 

50210 50230 50250 

CGACGAGGTGCCCACGGACAACCCGAAGGCGATGTACATGTCGGGCGGGCTCGAGCCGCT 

DEVPTDNPKAMYMS GGLEPL 

50270 50290 50310 

GACCAACCCCGGTCTCGGCGAGCTGGTGTCGCACGCCGCCGGGCGCGGTTTCGACCTCAC 
TN PGLGELVSHA AGRGFDLT 

50330 50350 50370 

CGTCTACACCAACGCCTTCGCCCTCACCGAGCAGACGCTGAACCGCCAGCCCGGCCTGTG 
VYTNAFALTEQTLNRQPGLW 

50390 50410 50430 

GGAGCTGGGCGCGATCCGCACGTCCCTCTACGGGCTGAACAACGACGAGTACGAGACGAC 
ELGA IRTSLYGLNNDEYETT 

50450 50470 50490 

CACCGGCAAGCGCGGCGCTTTCGAACGCGTCAAGAAGAACCTGCAGGGCTTCCTGCGGAT 

TGKRGAFERVKKNLQGFLRM 

50510 50530 50550 

GCGCGCCGAGCGGGACGCGCCGATCCGGCTCGGCTTCAACCACATCATCCTGCCGGGACG 

RAERDAPIRLGFNHI I LPGR 

50570 50590 50610 

GGCCGACCGGCTCACCGACCTCGTCGACTTCATCGCCGAGCTCAACGAGTCCAGCCCGCA 

AD-RLTDLVDFIAELN vE S S P Q 

50630 50650 50670 
ACGGCCGCTGGACTTCGTGACGGTGCGCGAGGACTACAGCGGCCGCGACGACGGCCGGCT^^^ 

RPLDFVTVREDYSGRDDGR 

50690 50710 50730 

GTCGGACTCCGAGCGCAACGAGCTGCGCGAGGGCCTGGTGCGGTTCGTCGACTACGCCGC 
SDSERNELREGLVRFVDYAA 

50750 50770 50790 

CGAGCGGACCCCGGGCATGCACATCGACCTGGGCTACGCCCTGGAGAGCCTGCGGCGGGG 

'ertpgmhidlgyaleslrrg 
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50810 50830 50850 

TGTGGACGCCGAGCTGCTGCGCATCCGGCCGGAGACGATGCGTCCCACCGCGCACCCCCA 

VDAELLRIRPETMRPTAHPQ 

50870 50890 50910 

GG'T'CGCGGTGCAGATCGACCTGCTCGGCGACGTCTACCTCTACCGCGAGGCGGGCTTCCC 

VAVQIDLLGDVYLYREAGFP 

50930 50950 50970 

GGAGCTGGAGGGCGCCACCCGCTACATCGCGGGCCGGGTCACCCCGTCGACCAGCCTGCG 

ELEGATRYIA^GRVTPSTSLR 

50990 51010 51030 

CGAGGTGGTGGAGAACTTCGTGCTGGAGAACGAGGGCGTGCAGCCCCGCCCCGGCGACGA' 

EVVENFVLENE GVQPRPGDE 

51050 51070 51090 

GTACTTCCTCGACGGCTTCGACCAGTCGGTGACCGCACGGCTCAACCAGCTCGAACGAGA 
YFLDGF DQSVTARLNQLERD 

51110 51130 51150 

CATCGCCGACGGGTGGGAGGACCACCGCGGCTTCCTGCGCGGAAGGTGAACCGGAGTTGC 

lADGWEDHRGFLRGR* 

51170 51190 51210 

GAGTACGTGAGCTGGCGGTGGCGGGCGGTTTCGAGTTCACCCCCGACCCGAAGCAGGACC 

V AGGFEFTPDPKQDR 

ORF19 > 

51230 51250 51270 

GGCGGGGCCTGTTCGTGTCTCCGCTGCAGGACGAGGCGTTCGTGGGCGCGGTGGGCCATC 
RGLFVSPLQDEAFVGAVGHR 

51290 51310 51330 

GGTTCCCCGTCGCCCAGATCAACCACATCGTCTCCGCCCGGGGCGTGCTGCGCGGGCTGC 
FPVAQMNHIVSARGVLRGLH 

51350 51370 51390 

i^CTTCACCACCACCCCGCCGGGGCAGTGCAAGTACGTCTACTGCGCGGGCGGCCGGGCGC 
FTTTPPGQCKYVYCARGRAL 

51410 51430 51450 

TCGACGTCATCGTCGACATCCGGGTCGGCTCGCCGACGTTCGGGJ^AGTGGGACGCGGTGG 
DVIVDIRVGSPTFGKWDAVE 

51470 51490 51510 

AGJ^TGGACACCGAGCACTTCCGGGCGGTCTACTTCCCCAGGGGCACCGCGCACGCCTTCC 

MDTEH FR AVYF PRGTAHA F L 
51530 51550 51570 

TCGCGCTTGAGGACGACACCCTGATGTCGTACCTGGTCAGCACGCCGTACGTGGCCGAGT 
ALEDDTLM SYLVSTPYVAEY 

51590 51610 51630 

ACGAGCAGGCGATCGACCCGTTCGACCCCGCGCTGGGTCTGCCGTGGCCCGCGGACCTGG 
EQ-AIDPFDPALGLPW.PADLE 

51650 51670 51690 

AGGTCGTGCTCrcCGACCGCGACACGGTGGCCGTGGACCTGGAGACCGCCAGGCGGCGAG^--— 
VVLSDRDTVAVDLET ARRRG 

51710 51730 51750 

GGATGCTGCCCGACTACGCCGACTGCCTCGGCGAGGAGCCCGCCAGCACCGGCAGGTGAC 

MLPDYADCLGEEPASTGR* 
* ASQRPSSGALVPLH 

< ORF2 0 . . . 
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LISTE DE SEQUENCES 



{ 1 ) INFORMATIONS GENERAIjES : 

5 

(i) DEPOSANT: 

(A) NOM: Hoechst Marion Roussel 

(B) RUE: 1, Terrasse Bellini 
{ C ) VI LLE : PUTEAUX 

10 (E) PAYS: FRANCE 

(F) CODE POSTAL: 92800 

(G) TELEPHONE: 01.49.91.57.27 

(H) TELECOPIE: 01.49.91.46.10 

(ii) TITRE DE L' INVENTION: Genes de biosynthese et de transfert des 
6-desoxyhexoses chez Saccharopolyspora erythraea et chez 
Streptomyces antibioticus et leur utilisation. 



20 



30 



35 



(iii) NOMBRE DE SEQUENCES: 61 



(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

2 5 (D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERIEURE : 

(A) NUMERO DE LA DEMANDE: FR 9709458 

(B) DATE DE DEPOT: 25-JXIL-1997 



(vi) DONNEES DE LA DEMANDE ANTERIEURE: 

(A) NUMERO DE LA DEMANDE: FR 9807411 

(B) DATE DE DEPOT: 12-JUN-1998 



(2) INFORMATIONS POUR LA SEQ ID NO : 1: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3439 paires de bases 
4 0 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 



45 



(ii) TYPE DE MOLECULE: ADNc 
(vi) ORIGINE: 
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2 

(A) ORGAMISME: Saccharopolyspora erythraea 

(ix) CARACTERISTIQUE : 
(A) NOM/CLE: CDS 
5 (B) EMPLACEMENT: complement (48.. 1046) 

(D) AUTRES INFORMATIONS : /f line tion= "implique dans la 
biosynthese du mycarose" 
/gene= "eryBII" 

10 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: complement (2322. .3404) 

(D) AUTRES INFORMATIONS : /function^ "implique dans la 
biosynthese de la desosamine" 
3_5 /gene= "eryCII" 



20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

GCTTCACGCT CACCAGCCGT ATCCTTTCTC GGTTCCTCTT GTGCTCACTG CAACCAGGCT 6 0 

TCCGGCGCCG CGCCGCCGGA GGCCACCGCG GGGAAGATCT CGTCCAGTTC GGACAGCGCC 12 0 

2 5 TGCTCGTCCA GGGTCATCGC GGACGCCTTC AGCGCGGAGT CGAGCTGCTC GGGGGTTCGC 18 0 

GGGCCGATGA CGGCGCCGGC GATGCCGGGC CGGGACAGCA CCCATGCGAG CCCCACCTCG 24 0 

GCCGGGTCTT CGCCGAGGTT GCGGCAGAAC TTCTCGTAGG CCTCGATCGC CGGGCGCAGG 3 00 

30 

GACGGCAACA GCACCTGCGC ACGGCCCTGC GCCGACTTCA CCGCGGTGCC CGCGGCCAGC 36 0 

TTCTCCAGCG CTCCGCTGAG CAGGCCGCCG TGCAGCGGCG ACCAGGCGAA GACGCCGAGC 420 

3 5 CCGTAGGCCT GCGCGGCGGG CAGCACCTCC AGCTCGGCGT GCCGGACCGC CAGGTTGTAC 480 

AGGCACTGGT GGGAGACCAT GCCCAGGGAG TGGCGGCGGG CGGCGTTCTC CTGCGCGGCG --=5^' 

GCGATGTGCC AGCCCGCGAA GTTCGACGAG CCGACGTAGG AGACCTTGCC GCTGGCGACG 6 00 

40 

AGGCTGTCCA TGGCCTGCCA CACCTCGTCC CACGGCGCGG ACCGGTCGAT GTGGTGCATC 66 0 

TGGTAGACGT CGATGTGGTC GACGCCCAGC CTGCGCAGCG ATCCCTCGCA GGAGGCGATG 72 0 

4 5 ATGTGCCGCG CCGACAGCCC GCTGTCGTTG ACGCGCTCGC TCATCTCGCC GCCGACCTTG 7 80 
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3 

GTCGCCAGCA CGGTGTCCTC GCGCCGTCCG CCGCCCTGGG CCAGCCACCT GCCCACCAGC 84 0 

TCCTCGGTGT GGCCCTTGTA GAGCCGCCAG CCGTACATGT CGGCGGTGTC GAGGCAGTTG 900 

5 ATGCCGCGGT CCCGGGCGTG GTCCATCAGG CGCAGCGCGT CGTCGTCCTC GACGCGTCCG 960 

CTGAAGTTCA CCGTGCCGAG CCAGAGCCTG CTGGTGAGCA GCGCGGAACG CCCGAGCCGC 102 0 

ACGTGCGTCG CGGCGTCGGT GGTCATCGTG GTTCTCTCCT TCCTGCGGCC AGTTCCTCGC 1080 

10 

AGATGCCGAC GACCTCGGCC GGTGACGGCT CCGCGAGCAT GTCGTCGCGC ATCCGCGCCG 114 0 

CGCCGGCGCG GTGGGCCGGG TCGTCGAGGA CCCGCTTCAC CGACTCCCGG AGCTGGTCGG 12 00 

15 GGGTCAGCTC GGGCACGGGC AGCGCGATCC CCGCCCCGAA TTCCTGCGTG CGCTGCGCGC 1260 

GCACGCCGGT GTCCCAGCCG TCGGGCAGGA TCACCTGCGG CACGCCGTGG ATCGCCGCGG 132 0 

TGTGCCAGCT CCCGGGTCCG CCGTGGTGCA CCGTCGCCGC GCAGGTCGGC AGCAGCGCGT 13 8 0 

20 

GCATCGGGAC GAAGCCGACC GTGCGGACGT TGTCCGGGAT GTTCGCGACG CCTTCTAGCT 14 4 0 

GCTGCGCGTC GAAGGTCGCG ATGATCTCGG CGTCGACGTC GCCGACGGCA CCCAGCAGCT 1500 

25 CCTCGATGGA GACCTGCCCG ATGCTGTTCT CGCGGCTGGA GATCCCGAGC GTGAGGCACA 156 0 

CGCGGCGGCG CTCGGGCTCG TCGTGCAGCC ATTCCGGCAC CACGGACGGC CCGTTGTAGT 162 0 

CGACGTAGCG CATCCCGACG GTCTTCAGGC CGGTGTCGAG CCTGATCGCG GCCGGGGCGG 16 8 0 

30 

GGTCGATCGT CCACTGCCCG ACGACCACCT CCTCGTCGAA GGCCGGGCCG CCGTACTTCT 174 0 

CCAGCGTCCA GGTGAGCCAC TCGGCGAGCG GGTCCTCCCG GTGCTCCTCC GGCTGGTCGG 18 00 

3 5 GCAGCAGGCC GAGGAAGTTC TGCCGCGCCC GGGTGGTGAT GTCGGGTCCC CACAGCAGCC 18 6 0 

GCGCGTGCGG CGTTCCGGTC ACCGCCGCCG CGATGGGCGC GGCGAAGGTG AGCGGCTCCC "1920 

AGATGACCAG GTCGGGCCGC CACTTCCGGC AGAACGAGAC CATGCCTTCG ATGAGCGTGT 198 0 

40 

CCGGGCTCAT CAGGGCGTAG AAGGTCGGGG TGAGCACGGT CTGCATGCCC AGCAGGTGCT 2 04 0 

CCCAGGTCAA GGTGGCGGGG TCCCGCTCGC TGAAGTCCAG GCTCCGGACG TAGTCGATGA 210 0 

4 5 TGTCGTGGCC CGCGTGGGTC ATGAAGTCCA CGAGGTCGAC GTCGGTGCCG ACCGGGACGG 216 0 



GCCAGGCGTC GATGTGCCG 

45 

(2) INFORMATIONS POUR LA SEQ ID NO : 2: 
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4 

CGGTCAGCCC GGCCGCGGTG ATGTCCTCGG TGAGCGCCGG GGACGCGACC ACGCGGACCT 2220 

CGTGCCCCGC CGCGCGGAAC GCCCATGCGA GGGGGACGAG GCCGAAGAGG TGGCTCTTGC 22 80 

5 TGGCCATGGA GGAGAAGACG ACGCGCATCG CGGTTACCTC AGAGCTCGAC GGGGCAGCGG 2340 

TTGGTTCCCC GCAGGACGGG TGATCGGCGG CGCCGGACGA CCGGGCCGCT GGGCGTGAGT 24 00 

CCGGGCAGCG CCTTGGCCGC GGCCCGCAGT GCGGCGGTGG CGAGCGCGGT GACCAGCTCC 2460 

10 

TCCAGCCTGC CGGGGTGGCC GCGATGTGCC GACAGCGCGC GGTCGGCGTC GGGGCGGTCC 2 520 

ACGTCGAGGC GGTCGGGCTC GGCGAAGACC TCCGGGTCGC GGTTGGCCGC CGCGACGACG 2580 

15 ACCACGACCT CCTCGCCTTC GCCGATCACG TGCTCGCCGA GCCGCACCTC TGCGGTGGCC 2 64 0 

GTGCGCCGCT CCAGGTGCAA TGCCGGGTGC AGGCGCAGCA CCTCGGCGAC GGTTCGCTGC 2 70 0 

GCGGCGGCGG GGTCGTCGGC GATCCGTTCG GCCAGCCCCG GTTCGGCCGA GACGGCCAGG 2 76 0 

20 

ACCGCGTCGA CCACGGTGTT CGCGGTCATC TCGGCCCCGG CGAACAGGGC GCGCAGTGCG 2 82 0 

GGGTCGGCGG GCAGTGCCGC GACCGCTGCT TCGGTCACCG CGAGCTGCTG CGGGCTGAGC 2 88 0 

2 5 TGGGCGTCCA GGCTGACGCG GGCGTCCCAC GCGGCGCCGC GCAGCACTCC GGCTGCGCCG 2 94 0 

AGCACGGCGG TCATGCCCTG CACCGGTACC TGCCAGGCGA AGTCGCCGAC CAGGTCCAGC 3 000 

CGCGCGCCCG CGCCGGGGAG CAGACCGGCG AAGCTCTCCG CCAGTTCCCC GACGTCGGGG 3 06 0 

30 

ACCTCGCCTT CCCAGGACGC GGCGTGCACG TCCCGGAACG GCTGGGCCCA CTCGGCGGGT 312 0 

GGCGCGCCCG CGGCCCGCAT CCATTCCGGT GTGCGTCCGG TGGCGCGGGT GAACGCGGGG 318 0 

3 5 TCGTCGAg'cA CCTGCCGGGC GGTGGCGTGG TCGGCCACCA CCCACGTCTC GGTGCGGCTG 324 0 

CGCCGCACAC CGGACTCGCG CATCGAGCGG TACCGGCGCT GCGGGTCGTC GTCGTGTCCG -Z-yO-Q- 

CACAGCAGCA TCGGGTAAGG GTCGCCGTTG CTGCCGTAAC CCCAGTGCAG GCCGCGGATC 336 0 

40 

ATCTGGAGCT GCCTGCCCAG CCCGGCGCGA TCGGTCGTGG TCATGAATTC CCTCCGCCCA 342 0 



3439 
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(i) CARACTERISTIQXJES DE LlA SEQUENCE: 

(A) LONGUEUR: 3 33 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

5 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 

Met Thr Thr Asp Ala Ala Thr His Val Arg Leu Gly Arg Ser Ala Leu 
10 1 5 10 15 

Leu Thr Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly Arg Val 
20 25 30 

15 Glu Asp Asp Asp Ala Leu Arg Leu Met Asp His Ala Arg Asp Arg Gly 
35 40 45 

lie Asn Cys Leu Asp Thr Ala Asp Met Tyr Gly Trp Arg Leu Tyr Lys 
50 55 60 

20 

Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Gin Gly Gly Gly 
65 70 75 80 

Arg Arg Glu Asp Thr Val Leu Ala Thr Lys Val Gly Gly Glu Met Ser 
25 85 90 95 

Glu Arg Val Asn Asp Ser Gly Leu Ser Ala Arg His lie lie Ala Ser 
100 105 110 

3 0 Cys Glu Gly Ser Leu Arg Arg Leu Gly Val Asp His lie Asp Val Tyr 
115 120 125 

Gin Met His His lie Asp Arg Ser Ala Pro Trp Asp Glu Val Trp Gin 
130 135 140 

35 

Ala Met Asp Ser Leu Val Ala Ser Gly Lys Val Ser Tyr Val Gly Ser 
145 150 155 160 

Ser Asn Phe Ala Gly Trp His lie Ala Ala Ala Gin Glu Asn Ala Ala 
40 165 170 175 

Arg Arg His Ser Leu Gly Met Val Ser" His Gin Cys Leu Tyr Asn Leu 
180 185 190 



4 5 Ala Val Arg His Ala Glu Leu Glu Val Leu Pro Ala Ala Gin Ala Tyr 
195 200 205 
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Gly Leu Gly Val Phe 
210 

Gly Ala Leu Glu Lys 
5 225 

Gly Arg Ala Gin Val 
245 

10 Tyr Glu Lys Phe Cys 
260 

Leu Ala T2rp Val Leu 
275 

15 

Pro Arg Thr Pro Glu 
290 

Thr Leu Asp Glu Gin 
20 305 

Val Ala Ser Gly Gly 
325 



Ala Trp Ser Pro Leu 
215 

Leu Ala Ala Gly Thr 
230 

Leu Leu Pro Ser Leu 
250 

Arg Asn Leu Gly Glu 
265 

Ser Arg Pro Gly lie 
280 

Gin Leu Asp Ser Ala 
295 

Ala Leu Ser Glu Leu 
310 

Ala Ala Pro Glu Ala 
330 



His Gly Gly Leu Leu Ser 
220 

Ala Val Lys Ser Ala Gin 
235 240 

Arg Pro Ala lie Glu Ala 
255 

Asp Pro Ala Glu Val Gly 
270 

Ala Gly Ala Val He Gly 
285 

Leu Lys Ala Ser Ala Met 
300 

Asp Glu He Phe Pro Ala 
315 320 

Trp Leu Gin 



25 

(2) INFORMATIONS POUR LA SEQ ID NO : 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 361 acides amines 
3 0 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

35 ' 

Met Thr Thr Thr Asp Arg Ala Gly Leu Gly Arg Gin Leu Gin Met lie 
15 10 15 

Arg Gly Leu His Trp Gly Tyr Gly Ser Asn Gly Asp Pro Tyr Pro Met 
40 20 25 30 

Leu Leu Cys Gly His Asp Asp Asp Pro Gin Arg Arg Tyr Arg Ser Met 
35 40 45 



4 5 Arg Glu Ser Gly Val Arg Arg Ser Arg Thr Glu Thr Trp Val Val Ala 
50 55 60 
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Asp His Ala Thr Ala Arg Gin Val Leu Asp Asp Pro Ala Phe Thr Arg 
65 70 75 80 

Ala Thr Gly Arg Thr Pro Glu Trp Met Arg Ala Ala Gly Ala Pro Pro 
5 85 90 95 

Ala Glu Trp Ala Gin Pro Phe Arg Asp Val His Ala Ala Ser Trp Glu 
100 105 110 

10 Gly Glu Val Pro Asp Val Gly Glu Leu Ala Glu Ser Phe Ala Gly Leu 
115 120 125 

Leu Pro Gly Ala Gly Ala Arg Leu Asp Leu Val Gly Asp Phe Ala Trp 
130 135 140 

15 

Gin Val Pro Val Gin Gly Met Thr Ala Val Leu Gly Ala Ala Gly Val 
145 150 155 160 

Leu Arg Gly Ala Ala Trp Asp Ala Arg Val Ser Leu Asp Ala Gin Leu 
20 165 170 175 

Ser Pro Gin Gin Leu Ala Val Thr Glu Ala Ala Val Ala Ala Leu Pro 
180 185 190 

25 Ala Asp Pro Ala Leu Arg Ala Leu Phe Ala Gly Ala Glu Met Thr Ala 
195 200 205 

Asn Thr Val Val Asp Ala Val Leu Ala Val Ser Ala Glu Pro Gly Leu 
210 215 220 

30 

Ala Glu Arg lie Ala Asp Asp Pro Ala Ala Ala Gin Arg Thr Val Ala 
225 230 235 : 240 

Glu Val Leu Arg Leu His Pro Ala Leu His Leu Glu Arg Arg Thr Ala 
35 " 245 250 255 

Thr Ala Glu Val Arg Leu Gly Glu His Val lie Gly Glu Gly Glu Glu 
260 265 270 

4 0 Val Val Val Val Val Ala Ala Ala Asn Arg Asp Pro Glu Val Phe Ala 
275 280 285 



Glu Pro Asp Arg Leu Asp Val Asp Arg Pro Asp Ala Asp Arg Ala Leu 
290 295 300 

45 



r 
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8 

Ser Ala His Arg Gly His Pro Gly Arg Leu Glu Glu Leu Val Thr Ala 
305 310 315 320 

Leu Ala Thr Ala Ala Leu Arg Ala Ala Ala Lys Ala Leu Pro Gly Leu 
5 325 330 335 

Thr Pro Ser Gly Pro Val Val Arg Arg Arg Arg Ser Pro Val Leu Arg 
340 345 350 

10 Gly Thr Asn Arg Cys Pro Val Glu Leu 
355 360 

(2) INFORMATIONS POUR LA SEQ ID NO : 4 : 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1266 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 



20 



(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Saccharopolyspora erythraea 



25 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: complement (4.. 1266) 

(D) AUTRES INFORMATIONS : /function = "implique dans la 
3 0 biosynthese de la desosamine" 

/gene= "eryCIII" 

/note= "SEQ ID NO 1 DE 1046 Af2308"- 



3 5 (xir DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

TCATCGTGGT TCTCTCCTTC CTGCGGCCAG TTCCTCGCAG ATGCCGACGA CCTCGGCCGG ^----^0- 

TGACGGCTCC GCGAGCATGT CGTCGCGCAT CCGCGCCGCG CCGGCGCGGT GGGCCGGGTC 12 0 

40 

GTCGAGGACC CGCTTCACCG ACTCCCGGAG CTGGTCGGGG GTCAGCTCGG GCACGGGCAG 18 0 

CGCGATCCCC GCCCCGAATT CCTGCGTGCG CTGCGCGCGC ACGCCGGTGT CCCAGCCGTC 24 0 



4 5 GGGCAGGATC ACCTGCGGCA CGCCGTGGAT CGCCGCGGTG TGCCAGCfcC CGGGTCCGCC 3 00 
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GTGGTGCACC GTCGCCGCGC AGGTCGGCAG CAGCGCGTGC ATCGGGACGA AGCCGACCGT 360 

GCGGACGTTG TCCGGGATGT TCGCGACGCC TTCTAGCTGC TGCGCGTCGA AGGTCGCGAT 42 0 

5 GATCTCGGCG TCGACGTCGC CGACGGCACC CAGCAGCTCC TCGATGGAGA CCTGCCCGAT 48 0 

GCTGTTCTCG CGGCTGGAGA TCCCGAGCGT GAGGCACACG CGGCGGCGCT CGGGCTCGTC 54 0 

GTGCAGCCAT TCCGGCACCA CGGACGGCCC GTTGTAGTCG ACGTAGCGCA TCCCGACGGT 6 00 

10 

CTTCAGGCCG GTGTCGAGCC TGATCGCGGC CGGGGCGGGG TCGATCGTCC ACTGCCCGAC 660 

GACCACCTCC TCGTCGAAGG CCGGGCCGCC GTACTTCTCC AGCGTCCAGG TGAGCCACTC 72 0 

15 GGCGAGCGGG TCCTCCCGGT GCTCCTCCGG . CTGGTCGGGC AGCAGGCCGA GGAAGTTCTG 78 0 

CCGCGCCCGG GTGGTGATGT CGGGTCCCCA CAGCAGCCGC GCGTGCGGCG TTCCGGTCAC 84 0 

CGCCGCCGCG ATGGGCGCGG CGAAGGTGAG CGGCTCCCAG ATGACCAGGT CGGGCCGCCA 90 0 

20 

CTTCCGGCAG AACGAGACCA TGCCTTCGAT GAGCGTGTCC GGGCTCATCA GGGCGTAGAA 96 0 

GGTCGGGGTG AGCACGGTCT GCATGCCCAG CAGGTGCTCC CAGGTCAAGG TGGCGGGGTC 102 0 

25 CCGCTCGCTG AAGTCCAGGC TCCGGACGTA GTCGATGATG TCGTGGCCCG CGTGGGTCAT 108 0 

GAAGTCCACG AGGTCGACGT CGGTGCCGAC CGGGACGGCG GTCAGCCCGG CCGCGGTGAT 114 0 

GTCCTCGGTG AGCGCCGGGG ACGCGACCAC GCGGACCTCG TGCCCCGCCG CGCGGAACGC 12 0 0 

30 

CCATGCGAGG GGGACGAGGC CGAAGAGGTG GCTCTTGCTG GCCATGGAGG AGAAGACGAC 12 6 0 

GCGCAT 12 6 6 

35 

(2) INFORMATIONS POUR LA SEQ ID NO : 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 421 acides amines 
4 0 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 5: 
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Met Arg Val Val Phe* Ser Ser Met Ala Ser Lys Ser His Leu Phe Gly 

1.5. 10 15 

Leu Val Pro Leu Ala Trp Ala Phe Arg Ala Ala Gly His Glu Val Arg 
5 20 25 30 

Val Val Ala Ser Pro Ala Leu Thr Glu Asp lie Thr Ala Ala Gly Leu 
35 40 45 

10 Thr Ala Val Pro Val Gly Thr Asp Val Asp Leu Val Asp Phe Met Thr 
50 55 60 

His Ala Gly His Asp lie lie Asp Tyr Val Arg Ser Leu Asp Phe Ser 
65 70 75 80 

15 

Glu Arg Asp Pro Ala Thr Leu Thr Trp Glu His Leu Leu Gly Met Gin 
85 90 95 

Thr Val Leu Thr Pro Thr Phe Tyr Ala Leu Met Ser Pro Asp Thr Leu 
20 100 105 110 

lie Glu Gly Met Val Ser Phe Cys Arg Lys Trp Arg Pro Asp Leu Val 
115 . 120 125 

2 5 lie Trp Glu Pro Leu Thr Phe Ala Ala Pro lie Ala Ala Ala Val Thr 
130 135 140 

Gly Thr Pro His Ala Arg Leu Leu Trp Gly Pro Asp lie Thr Thr Arg 
145 150 155 160 

30 

Ala Arg Gin Asn Phe Leu Gly Leu Leu Pro Asp Gin Pro Glu Glu His 
165 170 • 175 

Arg Glu Asp Pro Leu Ala Glu Trp Leu Thr Trp Thr Leu Glu Lys Tyr 
35 ' 180 185 .190 

Gly Gly Pro Ala Phe Asp Glu Glu Val Val Val Gly Gin Trp Thr lie 
195 200 205 

4 0 Asp Pro Ala Pro Ala Ala He Arg Leu Asp Thr Gly Leu Lys Thr Val 
210 215 220 



Gly Met Arg Tyr Val Asp Tyr Asn Gly Pro Ser Val Val Pro Glu Trp 
225 230 235 240 

45 
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Leu His Asp Glu Pro Glu Arg Arg Arg Val Cys Leu Thr Leu Gly lie 
245 250 255 

Ser Ser Arg Glu Asn Ser He Gly Gin Val Ser He Glu Glu Leu Leu 
5 260 265 270 

Gly Ala Val Gly Asp Val Asp Ala Glu He He Ala Thr Phe Asp Ala 
275 280 285 

10 Gin Gin Leu Glu Gly Val Ala Asn He Pro Asp Asn Val Arg Thr Val 
290 295 300 

Gly Phe Val Pro Met His Ala Leu Leu Pro Thr Cys Ala Ala Thr Val 
305 310 315 320 

15 

His His Gly Gly Pro Gly Ser Trp His Thr Ala Ala He His Gly Val 
325 330 335 

Pro Gin Val He Leu Pro Asp Gly Trp Asp Thr Gly Val Arg Ala Gin 
20 340 345 350 

Arg Thr Gin Glu Phe Gly Ala Gly He Ala Leu Pro Val Pro Glu Leu 
355 360 365 

25 Thr Pro Asp Gin Leu Arg Glu Ser Val Lys Arg Val Leu Asp Asp Pro 
370 375 380 

Ala His Arg Ala Gly Ala Ala Arg Met Arg Asp Asp Met Leu Ala Glu 
385 390 395 400 

30 

Pro Ser Pro Ala Glu Val Val Gly He Cys Glu Glu Leu Ala Ala Gly 
405 410 415 

Arg Arg Glu Pro Arg 
35 ' 420 

(2) INFORMATIONS POUR LA SEQ ID NO : 6 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
4 0 (A) LONGUEUR: 8160 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGtJRATION : lineaire 



4 5 (ii) TYPE DE MOLECULE: ADN (genomique) 



wo 99/05283 
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(vi) ORIGINE: 

(A) ORGANISME: Saccharopolyspora erythraea 

( ix) CARACTERISTIQUE : 
5 (A) NOM/CLE: CDS 

(B) EMPLACEMENT : 242 , .12 07 

(D) AUTRES INFORMATIONS :/function= "implique dans la 
biosynthese du mycarose" 
/gene= "eryBIV" 

10 /transl_except= (pos : 242 . . 244, aa : Met) 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 1210 . .24 54 

15 (D) AUTRES INFORMATIONS : /function= "implique dans la 

biosynthese du mycarose" 
/gene= "eryBV" 

/transl_except= (pos : 1210 1212, aa : Met) 

2 0 (ix) CARACTERISTIQUE: 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 2510 .. 32 2 0 

(D) AUTRES INFORMATIONS : /function^ "implique dans la 
biosynthese de la desosamine " 

2 5 /gene= "eryCVI" 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT : 33 08 . .4837 

3 0 (D) AUTRES INFORMATIONS : /function= "implique dans la 

biosynthese du mycarose" 
/gene= "eryBVI" 

/transl_except= (pos: 3308 3310, aa : Met) 

3 5 (ix*) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 608 0 . .7546 

(D) AUTRES INFORMATIONS : /function= "implique dans la 
biosynthese de la desosamine" 

4 0 /gene= "eryCV" 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 7 578. .8156 

45 (D) AUTRES INFORMATIONS : /function= "implique dans la 

biosynthese du mycarose" 
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/gene= "eryBVII" 

/transl_except= (pos : 7578 .. 7580, aa : Met) 

(ix) CARACTERISTIQUE : 
5 (A) NOM/CLE : mat_peptide 

{ B ) EMPLACEMENT ; 2 4 2 



10 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 6: 

TTTGACAGGT CCGCCACGCG TCCCCCTACT CGACGACCAC GCAATGGGCG AACAATATAG 6 0 

GAAGGATCAA GAGGTTGACA TCGCCTCGTC GAGCCAACGA ACCTGTGAAC ATCTGCATGT 120 

TGACAAGATC AACGGCGGCT ACCTACTGTG GTGGCCCAGT GACGGGTTGC CGCACATCGC 180 

GCTGGGGAGA TTCTTTGAAT TTCGCCCGTA GCACCGACCT GGAAAGCGAG CAAATGCTCC 24 0 

2 0 G GTG AAT GGG ATC AGT GAT TCC CCG CGT CAA TTG ATC ACC CTT CTG 286 
Met Asn Gly lie Ser Asp Ser Pro Arg Gin Leu lie Thr Leu Leu 
15 10 15 

GGC GCT TCC GGC TTC GTC GGG AGC GCG GTT CTG CGC GAG CTG CGC GAC 3 34 

2 5 Gly Ala Ser Gly Phe Val Gly Ser Ala Val Leu Arg Glu Leu Arg Asp 

20 25 30 

CAC CCG GTC CGG CTG CGC GCG GTG TCC CGC GGC GGA GCG CCC GCG GTT 3 82 

His Pro Val Arg Leu Arg Ala Val Ser Arg Gly Gly Ala Pro Ala Val 
30 35 40 45 

CCG CCC GGC GCC GCG GAG GTC GAG GAC CTG CGC GCC GAC CTG CTG GAA 430 

Pro Pro Gly Ala Ala. Glu Val Glu Asp Leu Arg Ala Asp Leu Leu Glu 

50 55 60 

35 

CCG GGC CGG GCC GCC GCC GCG ATC GAG GAC GCC GAC GTG ATC GTG CAC 4 78 

Pro Gly Arg Ala Ala Ala Ala lie Glu Asp Ala Asp Val lie Val His 

65 70 75 

4 0 CTG GTG GCG CAC GCA GCG GGC GGT TCC ACC TGG CGC AGC GCC ACC TCC 52 6 

Leu Val Ala His Ala Ala Gly Gly Ser Thr Trp Arg Ser Ala Thr Ser 
80 85 90 95 



GAC CCG GAA GCC GAG CGG GTC AAC GTC GGC CTG ATG CAC GAC CTC GTC 
4 5 Asp Pro Glu Ala Glu Arg Val Asn Val Gly Leu Met His' Asp Leu Val 

100 105 110 



574 
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GGC GCG CTG CAC GAT* CGC CGC AGG TCG ACG CCG CCC GTG TTG CTC TAG 622 

Gly Ala Leu His Asp Arg Arg Arg Ser Thr Pro Pro Val Leu Leu Tyr 
115 120 125 

5 GCG AGC ACC GCA CAG GCC GCG AAC CCG TCG GCG GCC AGC AGG TAC GCG 670 
Ala Ser Thr Ala Gin Ala Ala Asn Pro Ser Ala Ala Ser Arg Tyr Ala 
130 135 140 

CAG CAG AAG ACC GAG GCC GAG CGC ATC CTG CGC AAA GCC ACC GAC GAG 718 
10 Gin Gin Lys Thr Glu Ala Glu Arg lie Leu Arg Lys Ala Thr Asp Glu 
145 150 155 

GGC CGG GTG CGC GGC GTG ATC CTG CGG CTG CCC GCC GTC TAC GGC CAG 766 
Gly Arg Val Arg Gly Val lie Leu Arg Leu Pro Ala Val Tyr Gly Gin 
15 160 165 . 170 175 

AGC GGC CCG TCC GGC CCC ATG GGG CGG GGC GTG GTC GCA GCG ATG ATC 814 
Ser Gly Pro Ser Gly Pro Met Gly Arg Gly Val Val Ala Ala Met lie 
ISO 185 190 

20 

CGG CGT GCC CTC GCC GGC GAG CCG CTC ACC ATG TGG CAC GAC GGC GGC 8 62 

Arg Arg Ala Leu Ala Gly Glu Pro Leu Thr Met Trp His Asp Gly Gly 
195 200 205 

25 GTG CGC CGC GAC CTG CTG CAC GTC GAG GAC GTG GCC ACC GCG TTC GCC 910 
Val Arg Arg Asp Leu Leu Hig Val Glu Asp Val Ala Thr Ala Phe Ala 
210 215 220 

GCC GCG CTG GAG CAC CAC GAC GCG CTG GCC GGC GGC ACG TGG GCG CTG 95 8 

3 0 Ala Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu 
225 . 230 235 

GGC GCC GAC CGA TCC GAG CCG CTC GGC GAC ATC TTC CGG GCC GTC TCC 1006 
Gly Ala Asp Arg Ser Glu Pro Leu Gly Asp lie Phe Arg Ala Val Ser 
35 240 ' 245 250 255 

GGC AGC GTC GCC CGG CAG ACC GGC AGC CCC GCC GTC GAC GTG GTC ACC .^^^54. 

Gly Ser Val Ala Arg Gin Thr Gly Ser Pro Ala Val Asp Val Val Thr 

260 265 270 

40 

GTG CCC GCG CCC GAG CAC GCC GAG GCC AAC GAC TTC CGC AGC GAC GAC 1102 

Val Pro Ala Pro Glu His Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp 

275 280 285 



45 
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ATC GAC TCC ACC GAg'tTC CGC AGC CGG ACC GGC TGG CGC CCC CGG GTT 115 0 

lie Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val 
290 295 300 

5 TCC CTC ACC GAC GGC ATC GAC CGG ACG GTG GCC GCC CTG ACC CCC ACC 119 8 

Ser Leu Thr Asp Gly He Asp Arg Thr Val Ala Ala Leu Thr Pro Thr 
305 310 315 

GAG GAG CAC TA GTG CGG GTA CTG CTG ACG TCC TTC GCG CAC CGC ACG 124 5 

10 Glu Glu His Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr 
320 1 5 10 . 

CAC TTC CAG GGA CTG GTC CCG CTG GCG TGG GCG CTG CGC ACC GCG GGT 12 93 

His Phe Gin Gly Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly 
15 15 20 25 

CAC GAC GTG CGC GTG GCC GCC CAG CCC GCG CTC ACC GAC GCG GTC ATC 13 41 

His Asp Val Arg Val Ala Ala Gin Pro Ala Leu Thr Asp Ala Val He 
30 35 40 

20 

GGC GCC GGT CTC ACC GCG GTA CCC GTC GGC TCC GAC CAC CGG CTG TTC 13 8 9 

Gly Ala Gly Leu Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe 

45 50 55 60 

2 5 GAC ATC GTC CCG GAA GTC GCC GCT CAG GTG CAC CGC TAC TCC TTC TAC 14 3 7 

Asp He Val Pro Glu Val Ala Ala Gin Val His Arg Tyr Ser Phe Tyr 
65 70 75 

CTG GAC TTC TAC CAC CGC GAG CAG GAG CTG CAC TCG TGG GAG TTC CTG 14 8 5 

3 0 Leu Asp Phe Tyr His Arg Glu Gin Glu Leu His Ser Trp Glu Phe Leu 

80 85 90 

CTC GGC ATG CAG GAG GCC ACC TCG CGG TGG GTA TAC CCG GTG GTC AAC 15 3 3 

Leu Gly Met Gin Glu Ala Thr Ser Arg Trp Val Tyr Pro Val Val Asn 
35 '95 100 105 . 

AAC GAC TCC TTC _ GTC GCC GAG CTG GTC GAC TTC GCC CGG GAC TGG CGT 153.1- 
Asn Asp Ser Phe Val Ala Glu Leu Val Asp Phe Ala Arg Asp Trp Arg 
110 115 120 

40 

CCT GAC CTG GTG CTC TGG GAG CCG TTC ACC TTC GCC GGC GCC GTC GCG 162 9 

Pro Asp Leu Val Leu Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala 
125 ' 130 135 140 



45 
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GCC CGG GCC TGC 
Ala Arg Ala Cys 

5 CTC ACC GGC TAC 
Leu Thr Gly Tyr 
160 

CCG CCG GAG GAG 
10 Pro Pro Glu Asp 
175 

GCG GGG CGC TTC 
Ala Gly Arg Phe 
15 190 

TGG TCG GTC GAC 
Trp Ser Val Asp 
205 

20 

GAA ACC GTT GTC 
Glu Thr Val Val 

2 5 CCG GAC TGG CTC 

Pro Asp Trp Leu 
240 

GGA GGG TTC TCC 

3 0 Gly Gly Phe Ser 

255 

CGG ACG CTC GCG 
Arg Thr Leu Ala 
35 270* 

GGT TCC GGT CCG 
Gly Ser Gly Pro 
285 

40 

GAT TTC GTT CCG 
Asp Phe Val Pro 



GGA GCC GCG CAC GCC 
Gly Ala Ala His Ala 
145 

TTC CGC GGC CGG TTC 
Phe Arg Gly Arg Phe 
165 

CGG CCG GAC CCG CTG 
Arg Pro Asp Pro Leu 
180 

GGC GTC GAA TTC GGC 
Gly Val Glu Phe Gly 
195 

CAG TTG CCG CCG AGT 
Gin Leu Pro Pro Ser 
210 

GCG CGG ACC CTG CCC 
Ala Arg Thr Leu Pro 
225 

AAG AAG GGC AGT GCG 
Lys Lys Gly Ser Ala 
245 

GGA CTC GGG CTC GCC 
Gly Leu Gly Leu Ala 
260 

CAG CTC GCG CGA TTC 
Gin Leu Ala Arg Phe 
275 

GAT ACC TCC GCG GTA 
Asp Thr Ser Ala Val 
290 

ATG GGC GTT CTG CTC 
Met Gly Val Leu Leu 
305 



16 

CGG CTG CTG TGG GGC 
Arg Leu Leu Trp Gly 
150 

CAG GCG CAA CGC CTG 
Gin Ala Gin Arg Leu 
170 

GGC ACG TGG CTG ACC 
Gly Thr Trp Leu Thr 
185 

GAG GAC CTC GCG GTC 
Glu Asp Leu Ala Val 
200 

TTC CGG CTG GAC ACC 
Phe Arg Leu Asp Thr 
215 

TAC AAC GGC GCG TCG 
Tyr Asn Gly Ala Ser 
230 

ACT CGA CGC ATC TGC 
Thr Arg Arg lie Cys 
250 

GCC GAT GCC GAT CAG 
Ala Asp Ala Asp Gin 
265 

GAT GGC GAA ATC GTG 
Asp Gly Glu lie Val 
280 

CCG GAC AAC ATT CGT 
Pro Asp Asn lie Arg 
295 

CAG AAC TGC GCG GCG 
Gin Asn Cys Ala Ala 
310 
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AGC GAC 1677 

Ser Asp 

155 

CGA CGG 172 5 

Arg Arg 

GAG GTC 1773 
Glu Val 



GGG CAG 1821 
Gly Gin 

GGA ATG 1869 
Gly Met 
220 

GTG GTT 1917 

Val Val 

235 

ATT ACC 196 5 

lie Thr 



TTC GCG 2013 
Phe Ala 



GTT ACG 2 061 

Val Thr 

TTG GTG — 2-2r09 

Leu Val 
300 

ATC ATC 2157 

He He 

315 
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■ CAC CAC GGC GGG GCC GGA ACC TGG GCC ACG GCA CTG CAC CAC GGA ATT 2205 
His His Gly Gly Ala Gly Thr Trp Ala Thr Ala Leu His His Gly lie 
320 325 330 

5 CCG CAA ATA TCA GTT GCA CAT GAA TGG GAT TGC ATG CTA CGC GGC CAG 22 53 

Pro Gin lie Ser Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gin 
335 340 345 

CAG ACC GCG GAA CTG GGC GCG GGA ATC TAC CTC CGG CCG GAC GAG GTC 23 01 

10 Gin Thr Ala Glu Leu Gly Ala Gly lie Tyr Leu Arg Pro Asp Glu Val 
350 355 360 

GAT GCC GAC TCA TTG GCG AGC GCC CTC ACC CAG GTG GTC GAG GAC CCC 234 9 

Asp Ala Asp Ser Leu Ala Ser Ala Leu Thr Gin Val Val Glu Asp Pro 
15 365 ^ 370 375 380 

ACC TAC ACC GAG AAC GCG GTG AAG CTT CGC GAG GAG GCG CTG TCC GAC 23 97 

Thr Tyr Thr Glu Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp 

385 390 395 

20 

CCG ACG CCG CAG GAG ATC GTC CCG CGA CTG GAG GAA CTC ACG CGC CGC 244 5 

Pro Thr Pro Gin Glu lie Val Pro Arg Leu Glu Glu Leu Thr Arg Arg 

400 405 410 

25 CAC GCC GGC TAGCGGTTTC CGACCGACAA GTCCGTCCGA CAGCACACCT 24 94 

His Ala Gly 
415 

CCGGAGGGAG CAGGG ATG TAC GAG GGC GGG TTC GCC GAG CTT TAC GAC CGG 2 54 5 

3 0 Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg 

15 10 

TTC TAC CGC GGC CGG GGC AAG GAC TAC GCG GCC GAG GCC GCG CAG GTC 2593 
Phe Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gin Val 
35 '15 20 25 

GCG CGG CTG GTC AGA GAC CGC CTG CCC TCG GCT TCC TCG CTG CTC GAC —-21^^' 

Ala Arg Leu Val Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp 
30 35 40 

40 

GTG GCC TGC . GGG ACC GGC ACC CAC CTG CGC CGG TTC GCC GAC CTC TTC 268 9 

Val Ala Cys Gly Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe 
45 50 55 60 



45 
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GAC GAC GTG ACC GGG CTG GAG CTG TCG GCG GCG ATG ATC GAG GTC GCC 2 73 7 

Asp Asp Val Thr Gly Leu Glu Leu Ser Ala Ala Met lie Glu Val Ala 
65 70 75 

5 CGG CCG CAG CTC GGC GGC ATC CCG GTG CTG CAG GGC GAC ATG CGC GAC 2 78 5 

Arg Pro Gin Leu Gly Gly He Pro Val Leu Gin Gly Asp Met Arg Asp 
80 85 90 

TTC GCG CTG GAT CGC GAG TTC GAC GCC GTC ACC TGC ATG TTC AGC TCC 2 83 3 

10 Phe Ala Leu Asp Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser 
95 100 105 

ATC GGG CAC ATG CGC GAC GGC GCC GAG CTG GAC CAG GCG CTG GCG TCC 2 881 

He Gly His Met Arg Asp Gly Ala Glu Leu Asp Gin Ala Leu Ala Ser 
15 110 115 120 

TTC GCC CGC CAC CTC GCC CCC GGC GGC GTC GTG GTG GTC GAA CCG TGG 2 92 9 

Phe Ala Arg His Leu Ala Pro Gly Gly Val Val Val Val Glu Pro Trp 

125 130 135 140 

20 

TGG TTC CCG GAG GAC TTC CTC GAC GGC TAC GTG GCC GGT GAC GTG GTG 2 97 7 

Trp Phe Pro Glu Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val 
145 150 155 

2 5 CGC GAC GGC GAC CTG ACG ATC TCG CGC GTC TCG CAC TCC GTG CGC GCC 3 02 5 

Arg Asp Gly Asp Leu Thr He Ser Arg Val Ser His Ser Val Arg Ala 
160 165 170 

GGC GGC GCG ACC CGG ATG GAG ATC CAC TGG GTC GTG GCC GAC GCG GTG 3 07 3 

3 0 Gly Gly Ala Thr Arg Met Glu He His Trp Val Val Ala Asp Ala Val 

175 180 185 

AAC GGT CCG CGG CAC CAC GTG GAG CAC TAC GAG ATC ACG CTC TTC GAG 3121 
Asn Gly Pro Arg His His Val Glu His Tyr Glu He Thr Leu Phe Glu 
35 190- 195 200 

CGG CAG CAG TAC GAG AAG GCC TTC ACC GCG GCC GGT TGC GCT GTG CAG — 3«-9- 

Arg Gin Gin Tyr Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gin 
205 210 215 220 

40 

TAC CTG GAG GGC GGA CCC TCC GGA CGC GGG TTG TTC GTC GGT GTG CGC 3 217 

Tyr Leu Glu Gly Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg 

225 230 235 



4 5 GGA TGACCCGTGC GTTCGCGTTT TCCGTTCCTG GCACAGGTGA TCCGCTCCAC 
Gly 



3270 
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GGGCCCTTTC CCCGCCGTGA CCGGACCCTT ACAGTGA GTG CGG GTC TTG ATC GAC 3 325 

Met Arg Val Leu lie Asp 
1 5 

5 

AAC GCC CGG CGG CAG CAA GCG GAG CCG TCG ACG ACA CCG CAG GGA GAG 33 73 

Asn Ala Arg Arg Gin Gin Ala Glu Pro Ser Thr Thr Pro Gin Gly Glu 
10 15 20 

10 TCG ATG GGT GAT CGG ACC GGC GAC CGG ACG ATT CCG GAA TCC TCG CAG 3421 
Ser Met Gly Asp Arg Thr Gly Asp Arg Thr lie Pro Glu Ser Ser Gin 
25 30 35 

ACC GCA ACG CGT TTC CTG CTC GGC GAC GGC GGA ATC CCC ACC GCC ACG 346 9 

15 Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly Gly lie Pro Thr Ala Thr 
40 45 ■ 50 

GCG GAA ACC CAC GAC TGG CTG ACC CGC AAC GGC GCC GAG CAG CGG CTC 3 517 

Ala Glu Thr His Asp Trp Leu Thr Arg Asn Gly Ala Glu Gin Arg Leu 
20 55 60 65 70 

GAG GTG GCG CGC GTG CCG TTC AGC GCC ATG GAC CGC TGG TCG TTC CAG 35 65 

Glu Val Ala Arg Val Pro Phe Ser Ala Met Asp Arg Trp Ser Phe Gin 

75 80 85 

25 

CCC GAG GAC GGC AGG CTC GCC CAC GAG TCC GGG CGC TTC TTC TCC ATC 3 613 

Pro Glu Asp Gly Arg Leu Ala His Glu Ser Gly Arg Phe Phe Ser He 

90 • 95 100 

3 0 GAG GGC CTG CAC GTG CGG ACG AAC TTC GGC TGG CGG CGG GAC TGG ATC 3661 
Glu Gly Leu His Val Arg Thr Asn Phe Gly Trp Arg Arg Asp Trp He 
105 110 115 

CAG CCC ATC ATC GTG CAG CCC GAG ATC GGC TTC CTC GGC CTC ATC GTC 3 70 9 

3 5 Gin Pro He He Val Gin Pro Glu He Gly Phe Leu Gly . Leu He Val 
120 125 130 

AAG GAG. TTC GAC GGT GTG CTG CAC GTG CTG GCG CAG GCC AAG GCC GAG 3 75 7 

Lys Glu Phe Asp Gly Val Leu His Val Leu Ala Gin Ala Lys Ala Glu 
40 135 140 145 150 

CCG GGC AAC ATC AAC GCC GTC CAG CTC TCC CCG ACC CTG CAG GCG . ACC 3 80 5 

Pro Gly Asn He Asn Ala Val Gin Leu Ser Pro Thr Leu Gin Ala Thr 
155 160 165 

45 
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CGC AGC AAC TAG ACC GGC GTC CAC CGC GGC TCG AAG GTC CGG TTC ATC 3 8 53 
Arg Ser Asn Tyr Thr Gly Val His Arg Gly Ser Lys Val Arg Phe lie 
170 175 180 

5 GAG TAG TTC AAC GGC ACG CGC CCG AGC CGG ATC CTC GTC GAC GTG CTC 3 901 
Glu Tyr Phe Asn Gly Thr Arg Pro Ser Arg lie Leu Val Asp Val Leu 
185 190 195 



CAG TCC GAG CAG GGC GCG TGG TTC CTG CGC AAG CGC AAC CGG AAC ATG 3 94 9 

10 Gin Ser Glu Gin Gly Ala Trp Phe Leu Arg Lys Arg Asn Arg Asn Met 
200 205 210 

GTC GTC GAG GTG TTC GAC GAC CTG CCC GAG CAC CCG AAC TTC CGG TGG 3 997 

Val Val Glu Val Phe Asp Asp Leu Pro Glu His Pro Asn Phe Arg Trp 
15 215 220 225 230 



CTG ACC GTC GCG CAG CTG CGG GCG ATG CTG CAC CAC GAC AAC GTG GTG 4 04 5 

Leu Thr Val Ala Gin Leu Arg Ala Met Leu His His Asp Asn Val Val 
235 240 245 

20 

AAC ATG GAC CTG CGC ACC GTG CTG GCC TGC GTC CCG ACC GCC GTG GAG 4 0 93 

Asn Met Asp Leu Arg Thr Val Leu Ala Cys Val Pro Thr Ala Val Glu 
250 255 260 

25 CGG GAC CGG GCC GAC GAC GTG CTC GCG CGC CTG CCC GAG GGC TCG TTC 4141 
Arg Asp Arg Ala Asp Asp Val Leu Ala Arg Leu Pro Glu Gly Ser Phe 
265 270 275 



CAG GCC CGG CTG CTG CAC TCG TTC 

3 0 Gin Ala Arg Leu Leu His Ser Phe 
280 285 

AAC ATG AAC AGC CTG CTG AGC TGG 

Asn Met Asn Ser Leu Leu Ser Trp 
35 295 - 300 



ATC GGC GCG GGC ACC CCG GCC AAC 418 9 

lie Gly Ala Gly Thr Pro Ala Asn 
290 

ATC TCC GAC GTG CGC GCC AGG CGC 42 3 7 

lie Ser Asp Val Arg Ala Arg. Arg 
305 310 



40 



GAG TTC GTG CAG CGC GGC CGC CCG CTG CCC GAC ATC GAG CGC AGC GGG —4^5 

Glu Phe Val Gin Arg Gly Arg Pro Leu Pro Asp He Glu Arg Ser Gly 
315 320 325 

TGG ATC CGC CGC GAC GAC GGC ATC GAG CAC GAG GAG AAG AAG TAC TTC 43 33 

Trp He Arg Arg Asp Asp Gly He Glu His Glu Glu Lys Lys Tyr Phe 

330 335 340 
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GAC GTC TTC GGC GTC ACG GTG GCG ACC AGC GAC CGC GAG GTC AAC TCG 43 81 

Asp Val Phe Gly Val Thr Val Ala Thr Ser Asp Arg Glu Val Asn Ser 
345 350 355 

5 TGG ATG CAG CCG CTG CTC TCG CCC GCC AAC AAC GGC CTG CTC GCC CTG 44 2 9 

Trp Met Gin Pro Leu Leu Ser Pro Ala Asn Asn Gly Leu Leu Ala Leu 
360 365 370 

CTG GTC AAG GAC ATC GGC GGC ACG TTG CAC GCG CTC GTG CAG CTG CGC 44 77 

10 Leu Val Lys Asp lie Gly Gly Thr Leu His Ala Leu Val Gin Leu Arg 
375 380 385 390 

ACC GAG GCG GGC GGG ATG GAC GTC GCC GAG CTG GCG CCT ACG GTG CAC 452 5 

Thr Glu Ala Gly Gly Met Asp Val Ala Glu Leu Ala Pro Thr Val His 
15 395 400 405 

TGC CAG CCC GAC AAC TAC GCC GAC GCG CCC GAG GAG TTC CGA CCG GCC 4 5 73 

Cys Gin Pro Asp Asn Tyr Ala Asp Ala Pro Glu Glu Phe Arg Pro Ala 
410 415 420 

20 

TAT GTG GAC TAC GTG TTG AAC GTG CCG CGC TCG CAG GTC CGC TAC GAC 4621 

Tyr Val Asp Tyr Val Leu Asn Val Pro Arg Ser Gin Val Arg Tyr Asp 
425 430 * 435 

2 5 GCA TGG CAC TCC GAG GAG GGC GGC CGG TTC TAC CGC AAC GAG AAC CGG 466 9 

Ala Trp His Ser Glu Glu Gly Gly Arg Phe Tyr Arg Asn Glu Asn Arg 
440 445 450 

TAC ATG CTG ATC GAG GTG CCC GCC GAC TTC GAC GCC AGT GCC GCT CCC 4717 

3 0 Tyr Met Leu lie Glu Val Pro Ala Asp Phe Asp Ala Ser Ala Ala Pro 

455 460 465 470 

GAC CAC CGG TGG ATG ACC TTC GAC CAG ATC ACC TAC CTG CTC GGG CAC 4 76 5 

Asp His Arg Trp Met Thr Phe Asp Gin lie Thr Tyr Leu Leu Gly His 
35 ' 475 480 485 

AGC CAC TAC GTC AAC ATC CAG CTG CGC AGC ATC ATC GCG TGC GCC TCG 4^8^3- 

Ser His Tyr Val Asn lie Gin Leu Arg Ser lie lie Ala Cys Ala Ser 
490 495 500 

40 

GCC GTC TAC ACC AGG ACC GCC GGA TGAAACGCGC GCTGACCGAC CTGGCGATCT 486 7 

Ala Val Tyr Thr Arg Thr Ala Gly 

505 510 



4 5 TCGGCGGCCC CGAGGCATTC CTGCACACCC TCTACGTGGG CAGGCCGACC GTCGGGGACC 4 92 7 
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GGGAGCGGTT CTTCGCCCGC CTGGAGTGGG CGCTGAACAA CAACTGGCTG ACCAACGGCG 4 98 7 

GACCACTGGT GCGCGAGTTC GAGGGCCGGG TCGCCGACCT GGCGGGTGTC CGCCACTGCG 5 04 7 

5 TGGCCACCTG CAACGCGACG GTCGCGCTGC AACTGGTGCT GCGCGCGAGC GACGTGTCCG 510 7 

GCGAGGTCGT CATGCCTTCG ATGACGTTCG CGGCCACCGC GCACGCGGCG AGCTGGCTGG 516 7 

GGCTGGAACC GGTGTTCTGC GACGTGGACC CCGAGACCGG CCTGCTCGAC CCCGAGCACG 522 7 

10 

TCGCGTCGCT GGTGACACCG CGGACGGGCG CGATCATCGG CGTGCACCTG TGGGGCAGGC 52 8 7 

CCGCTCCGGT CGAGGCGCTG GAGAAGATCG CCGCCGAGCA CCAGGTCAAA CTCTTCTTCG 534 7 

15 ACGCCGCGCA CGCGCTGGGC TGCACCGCCG GCGGGCGGCC GGTCGGCGCC TTCGGCAACG 54 07 

CCGAGGTGTT CAGCTTCCAC GCCACGAAGG CGGTCACCTC GTTCGAGGGC GGCGCCATCG 54 6 7 

TCACCGACGA CGGGCTGCTG GCCGACCGCA TCCGCGCCAT GCACAACTTC GGGATCGCAC 5 52 7 

20 

CGGACAAGCT GGTGACCGAT GTCGGCACCA ACGGCAAGAT GAGCGAGTGC GCCGCGGCGA 5 58 7 

TGGGCCTCAC CTCGCTCGAC GCCTTCGCCG AGACCAGGGT GCACAACCGC CTCAACCACG 56 4 7 

25 CGCTCTACTC CGACGAGCTC CGCGACGTGC GCGGCATATC CGTGCACGCG TTCGATCCTG 5 7 07 

GCGAGCAGAA CAACTACCAG TACGTGATCA TCTCGGTGGA CTCCGCGGCC ACCGGCATCG 5 76 7 

ACCGCGACCA GTTGCAGGCG ATCCTGCGAG CGGAGAAGGT TGTGGCACAA CCCTACTTCT 582 7 

30 

CCCCCGGGTG CCACCAGATG CAGCCGTACC GGACCGAGCC GCCGCTGCGG CTGGAGAACA 58 8 7 

CCGAACAGCT CTCCGACCGG GTGCTCGCGC TGCCCACCGG CCCCGCGGTG TCCAGCGAGG 5 94 7 

3 5 ACATCCGGCG GGTGTGGGAC ATCATCCGGC TCGCCGCCAC CAGCGGCGAG CTGATCAACG 6 00 7 

CGCAATGGGA CCAGAGGACG CGCAACGGTT CGTGACGACC TGCGCCACAA GTGCCAGGAG —-=6-0-6^ 

GTTCGCTCCC CG ATG AAC ACA ACT CGT ACG GCA ACC GCC GAG GAA GCG 6115 

4 0 Met Asn Thr Thr Arg Thr Ala Thr Ala Gin Glu Ala 

15 10 

GGG GTC GCC GAC GCG GCG CGC CCG GAC GTC GAC CGG CGG GCG GTC GTG 616 3 
Gly Val Ala Asp Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val 
45 15 20 25 
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CGG GCG CTG AGC TCG GAG GTC TCC CGC GTC ACC GGC GCC GGT GAG GGT 6 211 

Arg Ala Leu Ser Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly 
30 35 40 

5 GAG GCC GAG GTG GAG GCC GCC CGG CTC GCC GAC GTC GCC GCG CAC TAG 6 2 59 

Asp Ala Asp Val Gin" Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr 
45 50 55 60 

GGG GCG CAC CCG TTC ACG CCG CTG GAG CAG ACG GGT GCG CGG CTC GGC 63 07 

10 Gly Ala His Pro Phe Thr Pro Leu Glu Gin Thr Arg Ala Arg Leu Gly 

65 70 , . 

CTG GAC CGC GCG GAG TTC GCC CAC CTG CTC GAC CTG TTC GGC CGC ATC 63 5 5 

Leu Asp Arg Ala Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg lie 
15 80 85 90 

CCG GAC CTG GGC ACC GCG GTG GAG CAC GGT CCG GCG GGC AAG TAG TGG 64 0 3 

Pro Asp Leu Gly Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp 
95 100 105 

20 

TCC AAC ACG ATC AAG CCG CTG GAC GCC GCA GGC GCA CTG GAC GCG GCG 64 51 

Ser Asn Thr lie Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala 
110 115 120 

25 GTC TAG CGC AAG CCT GCC TTC CCC TAC AGC GTC GGC CTG TAC CCG GGG 64 99 

Val Tyr Arg Lys Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly 
125 130 . 135 140 

CCG ACG TGC ATG TTC CGC TGC CAC TTC TGC GTG CGG GTG ACC GGT GCC 6 54 7 

3 0 Pro Thr Cys Met Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala 

145 150 155 

CGC TAC GAG GCC GCA TCG GTC CCG GCG GGC PiAC GAG ACG CTG GCC GCG 6 5 95 

Arg Tyr Glu Ala Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala 
35 ' 160 165 170 

ATC ATC GAC GAG GTG CCC ACG GAC AAC CCG AAG GCG ATG TAC ATG TCG — "6^3 
lie lie Asp Glu Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser 
175 180 185 

4 0 

GGC GGG CTC GAG CCG CTG ACC AAC CCC GGT CTC GGC GAG CTG GTG TCG 66 91 

Gly Gly Leu Glu Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser 
190 195 200 



45 
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CAC GCC GCC GGG CGC GGT TTC GAG CTC ACC GTC TAG ACC AAC GCC TTC 6 739 

His Ala Ala Gly Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe 
205 210 215 220 

5 GCC CTC ACC GAG CAG ACG CTG AAC CGC CAG CCC GGC CTG TGG GAG CTG 6 78 7 

Ala Leu Thr Glu Gin Thr Leu Asn Arg Gin Pro Gly Leu Trp Glu Leu 
225 230 235 

GGC GCG ATC CGC ACG TCC CTC TAC GGG CTG AAC AAC GAC GAG TAC GAG 6 83 5 

10 Gly Ala lie Arg Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu 
240 245 250 

ACG ACC ACC GGC AAG CGC GGC GCT TTC GAA CGC GTC AAG AAG AAC CTG 68 83 

Thr Thr Thr Gly Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu 
15 255 260 265 

CAG GGC TTC CTG CGG ATG CGC GCC GAG CGG GAC GCG CCG ATC CGG CTC 6 931 

Gin Gly Phe Leu Arg Met Arg Ala Glu Arg Asp Ala Pro lie Arg Leu 

270 275 280 

20 

GGC TTC AAC CAC ATC ATC CTG CCG GGA CGG GCC GAC CGG CTC ACC GAC 6 97 9 

Gly Phe Asn His lie lie Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp 
285 290 295 300 

25 CTC GTC GAC TTC ATC GCC GAG CTC AAC GAG TCC AGC CCG CAA CGG CCG 7 02 7 

Leu Val Asp Phe lie Ala Glu Leu Asn Glu Ser Ser Pro Gin Arg Pro 
305 310 315 

CTG GAC TTC GTG ACG GTG CGC GAG GAC TAC AGC GGC CGC GAC GAC GGC 707 5 

3 0 Leu Asp Phe Val Thr Val Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly 
320 325 330 

CGG CTG TCG GAC TCC GAG CGC AAC GAG CTG CGC GAG GGC CTG GTG CGG 712 3 

Arg Leu Ser Asp Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg 
35 • 335 340 345 

TTC GTC GAC TAC GCC GCC GAG CGG ACC CCG GGC ATG CAC ATC GAC CTG —=^^1" 

Phe Val Asp Tyr Ala Ala Glu Arg Thr Pro Gly Met His He Asp Leu 
350 355 360 

40 

GGC TAC GCC CTG GAG AGC CTG CGG CGG GGT GTG GAC GCC GAG CTG CTG 7219 

Gly Tyr Ala Leu Glu Ser Leu Arg. Arg Gly Val Asp Ala Glu Leu Leu 
365 370 375 380 



45 
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. CGC ATC CGG CCG GAG ACG ATG CGT CCC ACC GCG CAC CCC CAG GTC GCG 7267 
Arg lie Arg Pro Glu Thr Met Arg Pro Thr Ala His Pro Gin Val Ala 
385 390 395 

5 GTG CAG ATC GAC CTG CTC GGC GAC GTC TAG CTC TAC CGC GAG GCG GGC 7315 
Val Gin lie Asp Leu Leu Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly 
400 405 410 

TTC CCG GAG CTG GAG GGC GCC ACC CGC TAC ATC GCG GGC CGG GTC ACC 73 63 

10 Phe Pro Glu Leu Glu Gly Ala Thr Arg Tyr lie Ala Gly Arg Val Thr 
415 420 425 

CCG TCG ACC AGC CTG CGC GAG GTG GTG GAG AAC TTC GTG CTG GAG AAC 7411 
Pro Ser Thr Ser Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn 
15 430 435 440 

GAG GGC GTG CAG CCC CGC CCC GGC GAC GAG TAC TTC CTC GAC GGC TTC 74 5 9 

Glu Gly Val Gin Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe 
445 450 455 460 

20 

GAC CAG TCG GTG ACC GCA CGG CTC AAC CAG CTC GAA CGA GAC ATC GCC 750 7 

Asp Gin Ser Val Thr Ala Arg Leu Asn Gin Leu Glu Arg Asp lie Ala 
465 470 475 

2 5 GAC GGG TGG GAG GAC CAC CGC GGC TTC CTG CGC GGA AGG TGAACCGGAG 75 5 6 

Asp Gly Trp Glu Asp His Arg Gly Phe Leu Arg Gly Arg 
480 485 

TTGCGAGTAC GTGAGCTGGC G GTG GCG GGC GGT TTC GAG TTC ACC CCC GAC 76 0 7 

3 0 Met Ala Gly Gly Phe Glu Phe Thr Pro Asp 

1 5 10 

CCG AAG CAG GAC CGG CGG GGC CTG TTC GTG TCT CCG CTG CAG GAC GAG 76 5 5 

Pro Lys Gin Asp Arg Arg Gly Leu Phe Val Ser Pro Leu Gin Asp Glu 
35 ' 15 20 .25 

GCG TTC GTG GGC GCG GTG GGC CAT CGG TTC CCC GTC GCC CAG ATG AAC --:7^3- 

Ala Phe Val Gly Ala Val Gly His Arg Phe Pro Val Ala Gin Met Asn 
30 35 40 

40 

CAC ATC GTC TCC GCC CGG GGC GTG CTG CGC GGG CTG CAC TTC ACC ACC 77 51 

His lie Val Ser Ala Arg Gly Val Leu Arg Gly Leu His Phe Thr Thr 
45 50 55 
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ACC CCG CCG GGG CAg' TGC AAG TAG GTC TAG TGC GCG CGC GGC CGG GCG 7799 
Thr Pro Pro Gly Gin Cys Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala 
60 65 70 

5 CTC GAC GTC ATC GTC GAC ATC CGG GTC GGC TCG CCG ACG TTC GGG AAG 784 7 

Leu Asp Val lie Val Asp lie Arg Val Gly Ser Pro Thr Phe Gly Lys 
75 80 85 90 

TGG GAC GCG GTG GAG ATG GAC ACC GAG CAC TTC CGG GCG GTC TAC TTC 7 8 95 

10 Trp Asp Ala Val Glu Met Asp Thr Glu His Phe Arg Ala Val Tyr Phe 

95 100 105 

CCC AGG GGC ACC GCG CAC GCC TTC CTC GCG CTT GAG GAC GAC ACC CTG 7 94 3 

Pro Arg Gly Thr Ala His Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu 
15 110 115 . 120 

ATG TCG TAC CTG GTC AGC ACG CCG TAC GTG GCC GAG TAC GAG CAG GCG 7 991 

Met Ser Tyr Leu Val Ser Thr Pro Tyr Val Ala Glu Tyr Glu Gin Ala 
125 130 135 

20 

ATC GAC CCG TTC GAC CCC GCG CTG GGT CTG CCG TGG CCC GCG GAC CTG 8 03 9 

He Asp Pro Phe Asp Pro Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu 
140 145 150 

25 GAG GTC GTG CTC TCC GAC CGC GAC ACG GTG GCC GTG GAC CTG GAG ACC 8087 
Glu Val Val Leu Ser Asp Arg Asp Thr Val Ala Val Asp Leu Glu Thr 
155. 160 165 170 

GCC AGG CGG CGA GGG ATG CTG CCC GAC TAC GCC GAC TGC CTC GGC GAG 813 5 

3 0 Ala Arg Arg Arg Gly Met Leu Pro Asp Tyr Ala Asp Cys Leu Gly Glu 

175 180 185 

GAG CCC GCC AGC ACC GGC AGG TGAC 8160 
Glu Pro Ala Ser Thr Gly Arg 
35 ' 190 



(2) INFORMATIONS POUR LA SEQ ID NO : 7: 

4 0 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 322 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

4 5 <ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 7: 
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Met Asn Gly lie Ser 
1 5 

Ala Ser Gly Phe Val 
5 20 

Pro Val Arg Leu Arg 
35 

10 Pro Gly Ala Ala Glu 
50 

Gly Arg Ala Ala Ala 
65 

15 

Val Ala His Ala Ala 
85 

Pro Glu Ala Glu Arg 
20 100 

Ala Leu His Asp Arg 
115 

2 5 Ser Thr Ala Gin Ala 
130 

Gin Lys Thr Glu Ala 
145 

30 

Arg Val Arg Gly Val 
165 

Gly Pro Ser Gly Pro 
35 ' 180 

Arg Ala Leu Ala Gly 
195 

4 0 Arg Arg Asp Leu Leu 
210 



27 

Asp Ser Pro Arg Gin Leu 
10 

Gly Ser Ala Val Leu Arg 
25 

Ala Val Ser Arg Gly Gly 
40 

Val Glu Asp Leu Arg Ala 
55 

Ala lie Glu Asp Ala Asp 
70 75 

Gly Gly Ser Thr Trp Arg 
90 

Val Asn Val Gly Leu Met 
105 

Arg Arg Ser Thr Pro Pro 
120 

Ala Asn Pro Ser Ala Ala 
135 

Glu Arg lie Leu Arg Lys 
150 155 

lie Leu Arg Leu Pro Ala 
170 

Met Gly Arg Gly Val Val 
185 . 

Glu Pro Leu Thr Met Trp 
200 

His Val Glu Asp Val Ala 
215 
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lie Thr Leu Leu Gly 
15 

Glu Leu Arg Asp His 
30 

Ala Pro Ala Val Pro 
45 

Asp Leu Leu Glu Pro 
60 

Val lie Val His Leu 
80 

Ser Ala Thr Ser Asp 
95 

His Asp Leu Val Gly 
110 

Val Leu Leu Tyr Ala 
125 

Ser Arg Tyr Ala Gin 
140 

Ala Thr Asp Glu Gly 
160 

Val Tyr Gly Gin Ser 
175 

Ala Ala Met lie Arg 
190 

His Asp Gly Gly Val 
205 

Thr Ala Phe Ala Ala 
220 



Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu Gly 
225 230 235 240 

45 
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Ala Asp Arg Ser Glu Pro Leu Gly Asp lie Phe Arg Ala Val Ser Gly 
245 250 255 

Ser Val Ala Arg Gin Thr Gly Ser Pro Ala Val Asp Val Val Thr Val 
5 260 265 270 

Pro Ala Pro Glu His- Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp lie 
275 , 280 285 

10 Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val Ser 
290 295 300 

Leu Thr Asp Gly He Asp Arg Thr Val Ala Ala Leu Thr Pro Thr Glu 
305 310 315 320 

Glu His 



(2) INFORMATIONS POUR LA SEQ ID NO : 8: 

20 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 415 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

25 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 

Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr His Phe Gin Gly 
30 1 5 10 15 

Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His .Asp Val Arg 
20 25 30 

3 5 Val Ala- Ala Gin Pro Ala Leu Thr Asp Ala Val lie Gly Ala Gly Leu 
35 40 45 

Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe Asp lie Val Pro 
50 55 60 

40 

Glu Val Ala Ala Gin Val His Arg Tyr Ser Phe Tyr Leu Asp Phe Tyr 
65 70 75 80 



His Arg Glu Gin Glu Leu His Ser Trp Glu Phe Leu Leu Gly Met Gin 
45 85 90 ' 95 
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Glu Ala Thr Ser Arg 
100 

Val Ala Glu Leu Val 
5 115 

Leu Trp Glu Pro Phe 
130 

10 Gly Ala Ala His Ala 
145 

Phe Arg Gly Arg Phe 
165 

15 

Arg Pro Asp Pro Leu 
180 

Gly Val Glu Phe Gly 
r 2 0 195 

Gin Leu Pro Pro Ser 
210 

25 Ala Arg Thr Leu Pro 
225 

Lys Lys Gly Ser Ala 
245 

30 

Gly Leu Gly Leu Ala 
260 

Gin Leu Ala Arg Phe 
35 . 275 

Asp Thr Ser Ala Val 
290 

4 0 Met Gly Val Leu Leu 
305 

Ala Gly Thr Trp Ala 
325 

45 



Trp Val Tyr Pro Val 
105 

Asp Phe Ala Arg Asp 
120 

Thr Phe Ala Gly Ala 
135 

Arg Leu Leu Trp Gly 
150 

Gin Ala Gin Arg Leu 
170 

Gly Thr Trp Leu Thr 
185 

Glu Asp Leu Ala Val 
200 

Phe Arg Leu Asp Thr 
215 

Tyr Asn Gly Ala Ser 
230 

Thr Arg Arg lie Cys 
250 

Ala Asp Ala Asp Gin 
265 

Asp Gly Glu lie Val 
280 

Pro Asp Asn lie Arg 
295 

Gin Asn Cys Ala Ala 
310 

Thr Ala Leu His His 
330 



Val Asn Asn Asp Ser Phe 
110 

Trp Arg Pro Asp Leu Val 
125 

Val Ala Ala Arg Ala Cys 
140 

Ser Asp Leu Thr Gly Tyr 
155 160 

Arg Arg Pro Pro Glu Asp 
175 

Glu Val Ala Gly Arg Phe 
190 

Gly Gin Trp Ser Val Asp 
205 

Gly Met Glu Thr Val Val 
220 

Val Val Pro Asp Trp Leu 
235 240 

lie Thr Gly Gly Phe Ser 
255 

Phe Ala Arg Thr Leu Ala 

. 270 

Val Thr Gly Ser Gly Pro 
285 

Leu Val Asp Phe Val Pro 
300 

He lie His His Gly Gly 
315 320 

Gly He Pro Gin He Ser 
335 
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Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gin Gin Thr Ala Glu 
340 345 350 

Leu Gly Ala Gly lie Tyr Leu Arg Pro Asp Glu Val Asp Ala- Asp Ser 
5 355 360 365 

Leu Ala Ser Ala Leu Thr Gin Val Val Glu Asp Pro Thr Tyr Thr Glu 
370 375 380 

10 Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp Pro Thr Pro Gin 
385 390 395 400 

Glu lie Val Pro Arg' Leu Glu Glu Leu Thr Arg Arg His Ala Gly 
405 410 415 

15 

(2) INFORMATIONS POUR LA SEQ ID NO : 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
2 0 (A) LONGUEUR: 237 acides amines 

(B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

2 5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg Phe Tyr Arg Gly 
15 10 15 

3 0 Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gin Val Ala Arg Leu Val 

20 25 30 

Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp Val Ala Cys Gly 
35 40 45 

35 - 

Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe Asp Asp Val Thr 
50 55 60 

Gly Leu Glu Leu Ser Ala Ala Met lie Glu Val Ala Arg Pro Gin Leu 
40 65 70 75 80 

Gly Gly lie Pro Val Leu Gin Gly Asp Met Arg Asp Phe Ala Leu Asp 
.85 90 95 



45 Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser lie ^Gly His Met 
100 105 110 
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Arg Asp Gly Ala Glu Leu Asp Gin Ala Leu Ala Ser Phe Ala Arg His 
115 120 125 

Leu Ala Pro Gly Gly Val Val Val Val Glu Pro Trp Trp Phe Pro Glu 
5 130 135 140 

Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val Arg Asp Gly Asp 
145 150 155 160 

10 Leu Thr lie Ser Arg Val Ser His Ser Val Arg Ala Gly Gly Ala Thr 

165 170 175 

Arg Met Glu lie His Trp Val Val Ala Asp Ala Val Asn Gly Pro Arg 
180 185 190 

15 

His His Val Glu His Tyr Glu lie Thr Leu Phe Glu Arg Gin Gin Tyr 
195 200 205 

Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gin Tyr Leu Glu Gly 
20 210 215 220 

Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg Gly 
225 230 235 

25 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR; 510 acides amines 
3 0 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
35 . 

Met Arg Val Leu lie Asp Asn Ala Arg Arg Gin Gin Ala Glu Pro Ser 

1.5 10 15 

Thr Thr Pro Gin Gly Glu Ser Met Gly Asp Arg Thr Gly Asp Arg Thr 
40 20 25 30 

lie Pro Glu Ser Ser Gin Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly 
35 40 45 



45 Gly lie Pro Thr Ala Thr Ala Glu Thr His Asp Trp Leu' Thr Arg Asn 
50 55 60 
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Gly Ala Glu Gin Arg 
65 

Asp Arg Trp Ser Phe 
5 85 

Gly Arg Phe Phe Ser 
100 

10 Trp Arg Arg Asp Trp 
115 

Phe Leu Gly Leu lie 
130 

15 

Ala Gin Ala Lys Ala 
145 

Pro Thr Leu Gin Ala 
20 165 

Ser Lys Val Arg Phe 
180 

25 lie Leu Val Asp Val 
195 

Lys Arg Asn Arg Asn 
210 

30 

His Pro Asn Phe Arg 
225 

His His Asp Asn Val 
35 - 245 

Val Pro Thr Ala Val 
260 

4 0 Leu Pro Glu Gly Ser 
275 

Ala Gly Thr Pro Ala 
290 

45 



Leu Glu Val Ala Arg 
70 

Gin Pro Glu Asp Gly 
90 

lie Glu Gly Leu His 
105 

lie Gin Pro lie lie 
120 

Val Lys Glu Phe Asp 
135 

Glu Pro Gly Asn lie 
150 

Thr Arg Ser Asn Tyr 
170 

lie Glu Tyr Phe Asn 
185 

Leu Gin Ser Glu Gin 
200 

Met Val Val Glu Val 
215 

Trp Leu Thr Val Ala 
230 

Val Asn Met Asp Leu 
250 

Glu Arg Asp Arg Ala 
265 

Phe Gin Ala Arg Leu 
280 

Asn Asn Met Asn Ser 
295 



Val Pro Phe Ser Ala Met 
75 80 

Arg Leu Ala His Glu Ser 
95 

Val Arg Thr Asn Phe Gly 
110 

Val Gin Pro Glu lie Gly 
125 

Gly Val Leu His Val Leu 
140 

Asn Ala Val Gin Leu Ser 
155 160 

Thr Gly Val His Arg Gly 
175 

Gly Thr Arg Pro Ser Arg 
190 

Gly Ala Trp Phe Leu Arg 
205 

Phe Asp Asp Leu Pro Glu 
220 

Gin Leu Arg Ala Met Leu 
235 240 

Arg Thr Val Leu Ala Cys 
255 

Asp Asp Val Leu Ala Arg 
270 

Leu His Ser Phe lie Gly 
285 

Leu Leu Ser Trp lie Ser 
300 
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Asp Val Arg Ala Arg Arg Glu Phe Val Gin Arg Gly Arg Pro Leu Pro 
305 310 315 320 

Asp lie Glu Arg Ser Gly Trp lie Arg Arg Asp Asp Gly lie Glu His 
5 325 330 335 

Glu Glu Lys Lys Tyr Phe Asp Val Phe Gly Val Thr Val Ala Thr Ser 
340 ' 345 350 

10 Asp Arg Glu Val Asn Ser Trp Met Gin Pro Leu Leu Ser Pro Ala Asn 
355 360 365 

Asn Gly Leu Leu Ala Leu Leu Val Lys Asp lie Gly Gly Thr Leu His 
370 375 380 

15 

Ala Leu Val Gin Leu Arg Thr Glu Ala Gly Gly Met Asp Val Ala Glu 
385 390 395 400 

Leu Ala Pro Thr Val His Cys Gin Pro Asp Asn Tyr Ala Asp Ala Pro 
20 405 410 415 

Glu Glu Phe Arg Pro Ala Tyr Val Asp Tyr Val Leu Asn Val Pro Arg 
420 425 430 

25 Ser Gin Val Arg Tyr Asp Ala Trp His Ser Glu Glu Gly Gly Arg Phe 
435 440 445 

Tyr Arg Asn Glu Asn Arg Tyr Met Leu lie Glu Val Pro Ala Asp Phe 
450 455 460 

30 

Asp Ala Ser Ala Ala- Pro Asp His Arg Trp Met Thr Phe Asp Gin lie 
465 T 470 475 480 



Thr Tyr Leu Leu Gly His Ser His Tyr Val Asn lie Gin Leu Arg Ser 
35 • 485 490 495 

lie lie Ala Cys Ala Ser Ala Val Tyr Thr Arg Thr Ala Gly 
500 505 510 

40 ^ 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CTOIACTERISTIQUES DE LA SEQUENCE: 
(A). LONGUEUR: 48 9 acides amines 
4 5 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

Met Asn Thr Thr Arg Thr Ala Thr Ala Gin Glu Ala Gly Val Ala Asp 
5 1 5 10 15 

Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val Arg Ala Leu Ser 
20 25 30 

10 Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val 
35 40 45 

Gin Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr Gly Ala His Pro 
50 55 60 

15 

Phe Thr Pro Leu Glu Gin Thr Arg Ala Arg Leu Gly Leu Asp Arg Ala 
65 70 75 80 

Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg lie Pro Asp Leu Gly 
20 85 90 95 

Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp Ser Asn Thr lie 
100 105 110 

2 5 Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala Val Tyr Arg Lys 
115 120 125 

Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly Pro Thr Cys Met 
130 135 140 

30 

Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala Arg Tyr Glu Ala 
145 150 155 160 

Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala lie lie Asp Glu 
35 • 165 170 175 

Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser Gly Gly Leu Glu 
180 185 190 

4 0 Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser His Ala Ala Gly 
195 200 205 



Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe Ala Leu Thr Glu 
210 215 220 

45 



wo 99/05283 PCT/FR98/01593 

35 

Gin Thr Leu Asn Arg Gin Pro Gly Leu Trp Glu Leu Gly Ala lie Arg 
225 230 235 240 



5 Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu Thr Thr Thr Gly 

245 250 255 

Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu Gin Gly Phe Leu 
260 265 270 

10 

Arg Met Arg Ala Glu Arg Asp Ala Pro lie Arg Leu Gly Phe Asn His 
275 280 285 

lie lie Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp Leu Val Asp Phe 
15 290 295 300 

lie Ala Glu Leu Asn Glu Ser Ser Pro Gin Arg Pro Leu Asp Phe Val 
305 310 315 320 

2 0 Thr Val Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly Arg Leu Ser Asp 

325 330 335 

Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg Phe Val Asp Tyr 
340 345 350 

25 

Ala Ala Glu Arg Thr Pro Gly Met.. His lie Asp Leu Gly Tyr Ala Leu 
355 360 365 

Glu Ser Leu Arg Arg Gly Val Asp Ala Glu Leu Leu Arg lie Arg Pro 
30 370 375 380 

Glu Thr Met Arg Pro Thr Ala His Pro Gin Val Ala Val Gin lie Asp 
385 390 395 400 

3 5 Leu Leu .Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly Phe Pro Glu Leu 

405 410 415 

Glu Gly Ala Thr Arg Tyr lie Ala Gly Arg Val Thr Pro Ser Thr Ser 
420 425 430 

40 

Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn Glu Gly Val Gin 
435 440 445 



Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe Asp Gin Ser Val 
45 450 455 460 
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Thr Ala Arg Leu Asn Gin Leu Glu Arg Asp lie Ala Asp Gly Trp Glu 
465 470 475 480 

Asp His Arg Gly Phe Leu Arg Gly Arg 
5 485 



(2) INFORMATIONS POXXR LA SEQ ID NO: 12: 

10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 193 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 



15 (ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Ala Gly Gly Phe Glu Phe Thr Pro Asp Pro Lys Gin Asp Arg Arg 
15 10 15 

20 

Gly Leu Phe Val Ser Pro Leu Gin Asp Glu Ala Phe Val Gly Ala Val 
20 25 30 

Gly His Arg Phe Pro Val Ala Gin Met Asn His lie Val Ser Ala Arg 
25 35 40 45 

Gly Val Leu Arg Gly Leu His Phe Thr Thr Thr Pro Pro Gly Gin Cys 
50 55 60 

3 0 Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala Leu Asp Val lie Val Asp 
65 70 75 80 

lie Arg Val Gly Ser Pro Thr Phe Gly Lys Trp Asp Ala Val Glu Met 
85 90 95 

35 

Asp Thr Glu His Phe Arg Ala Val Tyr Phe Pro Arg Gly Thr Ala His 
100 105 110 

Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu Met Ser Tyr Leu Val Ser 
40 115 120 125 

Thr Pro Tyr Val Ala Glu Tyr Glu Gin Ala lie Asp Pro Phe Asp Pro 
130 135 140 



4 5 Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu. Glu Val Val Leu Ser Asp 
145 150 155 160 
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Arg Asp Thr Val 



Leu Pro Asp Tyr 
5 180 



Ala Val Asp Leu 
165 

Ala Asp Cys Leu 



Glu Thr Ala Arg 
170 

Gly Glu Glu Pro 
185 



Arg Arg Gly Met 
175 

Ala Ser Thr Gly 
190 



Arg 



10 (2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1206 paires de bases 

(B) TYPE: nucleotide 

15 (C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

2 0 (vi) ORIGINE:. 

(A) ORGANISME: Saccharopolyspora erythraea 

(ix) CARACTERISTIQUE : 
(A) NOM/CLE: CDS 
25 (B) EMPLACEMENT :1. .12 03 

(D) AUTRES INFORMATIONS : /function= "implique dans la 
biosynthese de la desosamine " 
/gene= "eryCIV" 

/note= "SEQ ID NO 6 DE 4837 A 6039" 



30 



35 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: mat_peptide 

( B ) EMPLACEMENT : 1 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 



ATG AAA CGC GCG CTG ACC GAC CTG GCG ATC TTC GGC GGC CCC GAG GCA 4 8 

Met Lys Arg Ala Leu Thr Asp Leu Ala lie Phe Gly Gly Pro Glu Ala 
40 1 5 10 15 

TTC CTG CAC ACC CTC TAC GTG GGC AGG CCG ACC GTC GGG GAC CGG GAG 96 
Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu 
20 25 30 

45 
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CGG TTC TTC GCC CGC CTG GAG TGG GCG CTG AAC AAC AAC TGG CTG ACC 144 

Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr 

35 40 45 

5 AAC GGC GGA CCA CTG GTG CGC GAG TTC GAG GGC CGG GTC GCC GAC CTG 192 

Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu 

50 55 60 

GCG GGT GTC CGC CAC TGC GTG GCC ACC TGC AAC GCG ACG GTC GCG CTG 24 0 

10 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu 

65 70 75 80 

CAA CTG GTG CTG CGC GCG AGC GAC GTG TCC GGC GAG GTC GTC ATG CCT 2 88 

Gin Leu Val Leu Arg Ala Ser Asp Val Ser. Gly Glu Val Val Met Pro 

15 85 ■ 90 95 

TCG ATG ACG TTC GCG GCC ACC GCG CAC GCG GCG AGC TGG CTG GGG CTG 336 

Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu 
100 105 110 

20 

GAA CCG GTG TTC TGC GAC GTG GAC CCC GAG ACC GGC CTG CTC GAC CCC 3 84 

Glu Pro Val Phe Cys Asp Val Asp Pro Glu Thr Gly Leu Leu Asp Pro 

115 120 125 

25 GAG CAC GTC GCG TCG CTG GTG ACA CCG CGG ACG GGC GCG ATC ATC GGC 432 

Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala lie lie Gly 

130 135 140 



GTG CAC CTG TGG GGC AGG CCC GCT CCG GTC GAG GCG CTG GAG AAG ATC 48 0 

3 0 Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys lie 
145 150 155 160 

GCC GCC GAG CAC CAG GTC AAA CTC TTC TTC GAC GCC GCG CAC GCG CTG 52 8 

Ala Ala Glu His Gin Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu 
35 • 165 ' 170 175 

GGC TGC ACC GCC GGC GGG CGG CCG GTC GGC GCC TTC GGC AAC GCC GAG .-.-..5^ 

Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu 
180 185 190 

40 

GTG TTC AGC TTC CAC GCC ACG AAG GCG GTC ACC TCG TTC GAG GGC GGC 624 

Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly 
195 200 205 
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GCC ATC GTC ACC GAG GAG GGG CTG CTG GCC GAG CGC ATC CGC GCC ATG 6 72 

Ala lie Val Thr Asp Asp Gly Leu Leu Ala Asp Arg lie Arg Ala Met 
210 215 220 

5 CAC AAC TTC GGG ATC GCA CCG GAC AAG CTG GTG ACC GAT GTC GGC ACC 72 0 

His Asn Phe Gly lie Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 
225 230 235 240 

AAC GGC AAG ATG AGC GAG TGC GCC GCG GCG ATG GGC CTC ACC TCG CTC 768 
10 Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu 

245 250 255 

GAC GCC TTC GCC GAG ACC AGG GTG CAC AAC CGC CTC AAC CAC GCG CTC 816 
Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu 
15 260 265 270 

TAC TCC GAC GAG CTC CGC GAC GTG CGC GGC ATA TCC GTG CAC GCG TTC 8 64 

Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly lie Ser Val His Ala Phe 

275 280 285 

20 

GAT CCT GGC GAG CAG AAC AAC TAC GAG TAC GTG ATC ATC TCG GTG GAC 912 

Asp Pro Gly Glu Gin Asn Asn Tyr Gin Tyr Val lie lie Ser Val Asp 

290 295 300 

25 TCC GCG GCC ACC GGC ATC GAC CGC GAC CAG TTG CAG GCG ATC CTG CGA 960 
Ser Ala Ala Thr Gly lie Asp Arg Asp Gin Leu Gin Ala lie Leu Arg 
305 310 315 320 

GCG GAG AAG GTT GTG GCA CAA CCC TAC TTC TCC CCC GGG TGC CAC CAG 1008 
3 0 Ala Glu Lys Val Val Ala Gin Pro Tyr Phe Ser Pro Gly Cys His Gin 

325 330 335 

ATG CAG CCG TAC CGG ACC GAG CCG CCG CTG CGG CTG GAG JkAC ACC GAA 10 56 

Met Gin Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu 
35 • 340 345 350 

CAG CTC TCC GAC CGG GTG CTC GCG CTG CCC ACC GGC CCC GCG GTG TCC .-*1^4- 

Gin Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser 
355 360 365 

40 

AGC GAG GAC ATC CGG CGG GTG TGC GAC ATC ATC CGG CTC GCC GCC ACC 1152 

Ser Glu Asp lie Arg Arg Val Cys Asp lie lie Arg Leu Ala Ala Thr 
370 375 380 
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40 

AGC GGC GAG CTG ATC AAC GCG CAA TGG GAC CAG AGG ACG CGC AAC GGT 120 0 

Ser Gly Glu Leu lie Asn Ala Gin Trp Asp Gin Arg Thr Arg Asn Gly 
385 390 395 400 

5 TCG TGA 12 06 

Ser 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 01 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

15 (ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUTENCE : SEQ ID NO: 14: 

Met Lys Arg Ala Leu Thr Asp Leu Ala lie Phe Gly Gly Pro Glu Ala 
15 10 15 

20 

Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu 
20 25 30 

Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr 
25 35 40 45 

Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu 
50 55 60 

3 0 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu 
65 70 75 80 

Gin Leu Val Leu Arg Ala Ser Asp Val Ser Gly Glu Val Val Met Pro 
85 90 95 

35 . - 

Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu 

100 105 110 . 

Glu Pro Val Phe Cys Asp Val Asp Pro Glu "Thr Gly Leu Leu Asp Pro 
40 115 120 125 

Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala lie lie Gly 
130 135 140 



4 5 Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys lie 
145 150 155 160 
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Ala Ala Glu His Gin Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu 
165 170 175 

Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu 
5 180 18*5 190 

Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly 
195 200 205 

10 Ala lie Val Thr Asp Asp Gly Leu Leu Ala Asp Arg lie Arg Ala Met 
210 215 220 

His Asn Phe Gly lie Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 
225 230 235 240 

15 

Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu 
245 250 255 

Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu 
20 260 265 270 

Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly lie Ser Val His Ala Phe 
275 280 285 

25 Asp Pro Gly Glu Gin Asn Asn Tyr Gin Tyr Val lie lie Ser Val Asp 
290 295 300 

Ser Ala Ala Thr Gly lie Asp Arg Asp Gin Leu Gin Ala lie Leu Arg 
305 310 315 320 

30 

Ala Glu Lys Val Val Ala Gin Pro Tyr Phe Ser Pro Gly Cys His Gin 
325 330 335 

Met Gin Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu 
35 ' 340 345 350 

Gin Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser 
355 360 365 

4 0 Ser Glu Asp lie Arg Arg Val Cys Asp lie lie Arg Leu Ala Ala Thr 
370 375 380 



Ser Gly Glu Leu lie Asn Ala Gin Trp Asp Gin Arg Thr Arg Asn Gly 
385 390 395 400. 
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(2) INFORMATIONS POUR LA SEQ ID NO: 15: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 6 093 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 



10 (ii) TYPE DE MOLECULE: ADN (genomique) 

(vi) ORIGINE: 

(A) ORGANISME : Streptomyces antibioticus 



15 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 184 . .1386 

(D) AUTRES INFORMATIONS : /gene= "olePl" 



2 0 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 1437 . .2714 

<D) AUTRES INFORMATIONS : /function= "glycosylation de 
8 , 8a-desoxyoleandolide" 
25 /gene= "oleGl" 

/transl_except= (pes: 1437 .. 1439, aa : Met) 



(ix) CARACTERISTIQUE: 
(A) NOM/CLE: CDS 
3 0 (B) EMPIoACEMENT : 2722 .. 3999 

(D) AUTRES INFORMATIONS : /f\mction= "glycosylation de 
8, 8a-desoxyoleandolide" 
/gene= "oleG2" 



3 5 (ix)' CARACTERISTIQUE: 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 4810 . , 5967 

(D) AUTRES INFORMATIONS : /gene= "oleY" 

4 0 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: mat_peptide 

( B ) EMPLACEMENT : 1 8 4 



45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 
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GCATGCCCCG CTTTCCTCCC CCTCTCCGAA CGCATCGACG ACCCGATCCC CCTCAGGGAC 60 



CGGTGAAGGA GCGTGTTGCA CTCATGCAGG ACATGCAAGG CGTACAGCCC GAACCAGCCA 12 0 

5 GTGTCGAACA CGCGGCGGAC GCAGCTCGAA CAGAGCGAAC GGCGCACGGA AGCCGCCCAG 18 0 

GAG ATG GAG GAG AGC GAA CTG GGG CGC CGC CTG CAG ATG CTC CGC GGC 228 
Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gin Met Leu Arg Gly 
15 10 15 

10 

ATG CAG TGG GTC TTC GGC GCC AAC GGC GAT CCG TAC GCC CGG CTG CTG 276 
Met Gin Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu 
20 25 30 

15 TGT GGC ATG GAG GAT GAC CCG TCA CCT TTC TAC GAC GCG ATA CGG ACC 324 
Cys Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala lie Arg Thr 
35 40 45 

CTG GGC GAG CTG CAC CGG AGC AGG ACC GGA GCC TGG GTC ACC GCC GAC 3 72 

2 0 Leu Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp 

50 55 60 

CCC GGG CTC GGG GGC CGC ATC CTC GCC GAC CGG AAG GCT CGG TGC CCG 42 0 

Pro Gly Leu Gly Gly Arg lie Leu Ala Asp Arg Lys Ala Arg Cys Pro 
25 65 70 75 

GAA GGC TCG TGG CCG GTG CGG GCG AAG ACC GAC GGG CTG GAG CAG TAC 46 8 

Glu Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gin Tyr 
80 85 . 90 95 

30 

GTG CTG CCC GGG CAC CAG GCG TTC CTG CGG CTG GAG CGC GAG GAG GCC 516 

Val Leu Pro Gly His Gin Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala 
100 105 110 

3 5 GAG CGA CTG CGG GAG GTC GCG GCG CCG GTG CTG GGG GCC GCG GCG GTC 564 

Glu Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val 

115 120 125 -'-'-^ 

GAC GCG TGG CGC CCG CTG ATC GAC GAG GTC TGC GCG GGG CTC GCG AAG 612 

4 0 Asp Ala Trp Arg Pro Leu lie Asp Glu Val Cys Ala Gly Leu Ala Lys 

130 135 140 

GGG CTG CCG GAC ACG TTC GAC CTG GTC GAG GAG TAC GCG GGG CTG GTG 660 
Gly Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val 
45 145 150 155 
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CCG GTC GAG GTG 
Pro Val Glu Val 
160 

5 GCC CGG TTC GGG 
Ala Arg Phe Gly 

CTC CTG TGT CCC 
10 Leu Leu Cys Pro 
195 

CTG GAG GAG CTG 
Leu Glu Asp Leu 
15 210 

CTC GCC GGC CCC 
Leu Ala Gly Pro 
225 

20 

GTT CTG CTC TGC 
Val Leu Leu Cys 
240 

2 5 CTC GGG CTC CTT 

Leu Gly Leu Leu 

GCT GCC GGG CAG 

3 0 Ala Ala Gly Gin 

275 

CGT ATC GCG ACG 
Arg lie Ala Thr 
35 ' 290 

GAG GTC AAG TCC 
Glu Val Lys Ser 
305 

40 

CGG AAC GGA CCG 
Arg Asn Gly Pro 
• 320 

45 



CTG GCG CGG ATC TGG 
Leu Ala Arg lie Trp 
165 

CGT GAC TGC CGG GCG 
Arg Asp Cys Arg Ala 
180 

CAG CAG TTG GCG CTG 
Gin Gin Leu Ala Leu 
200 

CGT CTC CTC TTC GAC 
Arg Leu Leu Phe Asp 
215 

GCC GAC GGT GAC GGA 
Ala Asp Gly Asp Gly 
230 

ACG GAG CCG GTG ACC 
Thr Glu Pro Val Thr 
24 5 

CCC GGG CAG TGG CCC 
Pro Gly Gin Trp Pro 
260 

GTT GCC GGG CAG GCG 
Val Ala Gly Gin Ala 
280 

CGG TTC GCC CGG GAG 
Arg Phe Ala Arg Glu 
295 

GGT GAC GAG GTG GTG 
Gly Asp Glu Val Val 
310 

TCC GCA GCC GCC CCG 
Ser Ala Ala Ala Pro 
325 



44 

GGC GTC CCG GAG GAG 
Gly Val Pro Glu Glu 
170 

CTC GCT CCC GCG CTG 
Leu Ala Pro Ala Leu 
185 

AGC AAG GAC ATG GCG 
Ser Lys Asp Met Ala 
205 

GGC CTC GAC GCG ACG 
Gly Leu Asp Ala Thr 
220 

ACG GCC GTG GCC ATG 
Thr Ala Val Ala Met 
235 

ACG GCG ATC GGG AAC 
Thr Ala lie Gly Asn 
250 

GTG CCC TGG ACC GGC 
Val Pro Cys Thr Gly 
265 

CTG CAC CGG GCG GTG 
Leu His Arg Ala Val 
285 

GAC CTG GAG TTG GCG 
Asp Leu Glu Leu Ala 
300 

GTC CTG GCC GGA GCG 
Val Leu Ala Gly Ala 
' 315 

CCT GCC CCA CCG GGC 
Pro Ala Pro Pro Gly 
330 
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GAC CGC 7 08 

Asp Arg 
175 

GAC AGC 756 
Asp Ser 
190 

TCC GCC 804 
Ser Ala 

CCG CGC 8 52 

Pro Arg 

CTC ACC 90 0 

Leu Thr 

ACC GTG 94 8 

Thr Val 
255 

CGG GTG 9 96 

Arg Val 
270 

TCG TAC 1044 
Ser Tyr 

GGC TGC 10 92 

Gly Cys 

ATC GGC .._.JJL4 0 
lie Gly 

CCA GCG 1188 
Pro Ala 
335 
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GCC CCG CCC GCC CCG TCG GTC TTC GGT GCC GCC GCC TTC GAG AAC GCG 1236 

Ala Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala 
340 345 350 

5 CTG GCC GAA CCC CTC GTC CGG GCT GTG ACG GGA GCG GCC CTC CAG GCC 1284 
Leu Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gin Ala 
355 360 365 

CTC GCG GAG GGG CCC CCC CGG CTG ACG GCG GCG GGA CCC GTC GTA CGA 133 2 

10 Leu Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg 
370 375 380 

CGG CGG CGT TCC CCT GTC GTC GGC GGG CTG CAC CGG GCT CCG GTG GCC 1380 
Arg Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala 
15 385 390 395 

GCC- GCA TGAGCATCGC GTCGAACGGC GCGCGCTCGG CCCCCCGCCG GCCCCTGCGC 14 3 6 

Ala Ala 

400 

20 

GTG ATG ATG ACC ACC TTC GCG GCC AAC ACG CAC TTC CAG CCG CTG GTT 14 84 

Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gin Pro Leu Val 
1 5 10 15 

2 5 CCC CTG GCC TGG GCA CTG CGG ACA GCC GGG CAC GAG- GTG CGC GTG GTG 1532 

Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val 
20 25 30 

AGC CAG CCC TCG CTG AGC GAC GTG GTG ACG CAG GCG GGG CTC ACC TCG 158 0 

3 0 Ser Gin Pro Ser Leu Ser Asp Val Val Thr Gin Ala Gly Leu Thr Ser 

35 40 45 

GTC CCG GTG GGC ACC GAG GCT CCG GTC GAG CAG TTC GCG GCG ACC TGG 1628 
Val Pro Val Gly Thr Glu Ala Pro Val Glu Gin Phe Ala Ala Thr Trp 
35 50 - 55 60 

GGC GAC GAT GCC TAC. ATC GGC GTC AAC AGC ATC GAC TTC ACC GGC AAC -'16-76— ' 

Gly Asp Asp Ala Tyr lie Gly Val Asn Ser lie Asp Phe Thr Gly Asn 

65 . 70 75 80 

40 

GAC CCC GGC CTG TGG ACG TGG CCG TAC CTC CTG GGC ATG GAG ACC ATG 1724 

Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met Glu Thr Met 

85 90 95 



45 



wo 99/05283 



PCT/FR98/01593 



46 

CTG GTG CCG GCC TTC TAG GAG TTG CTG AAC AAC GAG TCC TTC GTG GAG 17 72 

Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp 
100 105 110 



5 GGC GTA GTC GAG TTC GCC CGT GAC TGG CGG CCC GAC CTG GTG ATC TGG 182 0 

Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val lie Trp 
115 120 125 



GAG CCG CTG ACG TTC GCC GGC GCG GTG GCG GCG CGC GTC ACC GGC GCG 1868 

10 Glu Pro Leu thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala 
130 135 140 

GCC CAC GCC CGG CTG CCG TGG GGG CAG GAG ATC ACC CTG CGC GGG CGG 1916 

Ala His Ala Arg Leu Pro Trp Gly Gin Glu lie Thr Leu Arg Gly Arg 
15 145 150 155 160 



CAG GCG TTC CTC GCC GAG CGT GCC CTG CAA CCG TTC GAG CAC CGG GAG 1964 

Gin Ala Phe Leu Ala Glu Arg Ala Leu Gin Pro Phe Glu His Arg Glu 

165 170 175 

20 

GAT CCC ACG GCC GAG TGG CTG GGC CGC ATG CTC GAC CGG TAC GGC TGC 2 012 

Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys 
180 185 190 

2 5 TCG TTC GAC GAG GAG ATG GTC ACC GGG CAG TGG ACC ATC GAC ACG CTG 206 0 

Ser Phe Asp Glu Glu Met Val Thr Gly Gin Trp Thr lie Asp Thr Leu 
195 200 205 



CCG CGC AGC ATG CGG CTG GAG CTG TCC GAG GAG CTG CGC ACC CTG GAC 2108 

3 0 Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp 
210 215 220 

ATG CGG TAC GTG CCG TAC AAC GGA CCG GCG GTC GTA CCC CCC TGG GTG 215 6 

Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 

35 225 , ' 230 235 240 



TGG GAA CCG TGC GAG CGG CCC CGG GTC TGT CTG ACG ATC GGC ACC TCC — 22tr4" 

Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr lie Gly Thr Ser 

245 250 255 

40 

CAG CGT GAC TCC GGC CGG GAC CAT GTC CCC CTC GAC CAC CTG CTC GAC 22 52 

Gin Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp 
260 265 270 
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TCC CTC GCC GAC GTG GAG GCG GAG ATC GTG GCC ACG CTC GAG ACC ACC 23 00 

Ser Leu Ala Asp Val Asp Ala Glu He Val Ala Thr Leu Asp Thr Thr 
275 280 285 

5 CAG CAG GAG CGC CTG CGG GGC GCG GCC CCC GGC AAC GTC CGG CTG GTG 234 8 

Gin Gin Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val 
290 295 300 

GAC TTC GTC CCG CTG CAC GCG CTG ATG CCG ACC TGC TCG GCG ATC GTG 2 3 96 

10 Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala He Val 
305 310 315 320 

CAC CAC GGT GGT CCG GGC ACG TGG TCG ACG GCG GCG CTC CAC GGC GTC 2444 
His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val 
15 325 330 335 

CCG CAG ATC ATC CTG GAC ACC TCG TGG GAC ACA CCG GTG CGG GCG CAG 24 92 

Pro Gin He He Leu Asp Thr Ser Trp Asp Thr Pro Val Arg Ala Gin 
340 345 350 

20 

CGC ATG CAG CAA CTC GGG GCG GGC CTG TCG ATG CCG GTG GGG GAA CTG 254 0 

Arg Met Gin Gin Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu 
355 360 365 

25 GGC GTC GAG GCG CTG CGG GAC CGG GTC CTG CGG CTG CTG GGG GAG CCG 25 88 

Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro 
370 375 380 

GAG TTC CGC GCG GGC GCC GAG CGG ATC CGG GCC GAG ATG CTC GCG ATG 26 36 

3 0 Glu Phe Arg Ala Gly Ala Glu Arg He Arg Ala Glu Met Leu Ala Met 
385 390 395 400 

CCC GCC CCC GGT GAC GTC GTA CCG GAC CTG GAA CGA CTC ACC GCG GAG 2 6 84 

Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu 
35 ' 405 410 415 

CAT GCC ACC GGC GCG ATG GCG GGA AGG CGG TGAGACG ATG CGC GTA CTG -2 783- 

His Ala Thr Gly Ala Met Ala Gly Arg Arg Met Arg Val Leu 

420 425 1 

40 

CTG ACC TGC TTC GCC AAC GAC ACC CAC TTC CAC GGG CTG GTG CCG CTG 2 781 

Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly Leu Val Pro Leu 
5 10 15 20 

45 
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GCG TGG GCG CTG CGG GCC GCC GGG CAC GAA GTC CGC GTG GCC AGT GAG 282 9 

Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg Val Ala Ser Gin 
25 30 35 

5 CCC GCC CTG TCC GAC ACG ATC ACC CAA GCG GGA CTG ACC GCG GTG CCC 2 8 77 

Pro Ala Leu Ser Asp Thr He Thr Gin Ala Gly Leu Thr Ala Val Pro 
40 45 50 

GTG GGC CGG GAC ACC GCC TTC CTG GAG CTG ATG GGG GAG ATC GGC GCG 2 925 

10 Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly Glu He Gly Ala 
55 60 65 

GAC GTC CAG AAG TAC TCC ACC GGC ATC GAC CTG GGC GTC CGC GCG GAG 2 973 

Asp Val Gin Lys Tyr Ser Thr Gly He Asp Leu Gly Val Arg Ala Glu 
15 70 75 80 

CTG ACG AGC TGG GAG TAC CTG CTC GGC ATG CAC ACG ACC CTG GTG CCC 3 021 

Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr Thr Leu Val Pro 

85 90 95 100 

20 

ACG TTC TAC TCG CTG GTC AAC GAC GAG CCG TTC GTC GAC GGG CTC GTC 3 06 9 

Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val Asp Gly Leu Val 
105 110 115 

25 GCG CTG ACC CGG GCC TGG CGG CCC GAC CTC ATC CTG TGG GAG CAC TTC 3117 
Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu He Leu Trp Glu His Phe 
120 125 130 

AGC TTC GCC GGG GCG TTG GCG GCG CGG GCC ACC GGC ACG CCC CAC GCC 316 5 

3 0 Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly Thr Pro His Ala 
135 140 145 

CGC GTG CTG TGG GGG TCG GAC CTC ATC GTC CGG TTC CGC CGG GAC TTC 3 213 

Arg Val Leu Trp Gly Ser Asp Leu He Val Arg Phe Arg Arg Asp Phe 
35. 150 - 155 160 

CTC GCG GAG CGG GCG AAC CGG CCC GCC GAG CAC CGC GAG GAC CCC ATG -32^-1- 

Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg Glu Asp Pro Met 
165 170 175 180 

40 

GCG GAG TGG CTG GGC TGG GCG GCC GAA CGG CTG GGC TCC ACC TTC GAC 3 3 09 

Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly Ser Thr Phe Asp 
185 190 195 
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GAG GAG CTG GTG ACC GGG CAG TGG ACG ATC GAC CCG CTG CCG CGG AGC 33 57 

Glu Glu Leu Val Thr Gly Gin Trp Thr lie Asp Pro Leu Pro Arg Ser 
200 205 210 

5 ATG CGG CTG CCC ACC GGG ACG ACG ACG GTG CCG ATG CGG TAC GTG CCG 34 05 

Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met Arg Tyr Val Pro 
215 220 225 

TAC AAC GGG CGG GCC GTG GTC CCC GCA TGG GTC CGG CAG CGT GCG CGG 34 5 3 

10 Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg Gin Arg Ala Arg 
230 235 240 

CGG CCC CGG ATC TGC CTG ACG CTC GGT GTG TCG GCC CGG CAG ACC CTG 3 5 01 

Arg Pro Arg lie Cys Leu Thr Leu Gly Val Ser Ala Arg Gin Thr Leu 
15 245 250 255 260 

GGC GAC GGC GTG TCG CTG GCG GAG GTG CTG GCC GCG CTG GGC GAC GTG 3 54 9 

Gly Asp Gly Val. Ser Leu Ala Glu Val Leu Ala Ala Leu Gly Asp Val 
265 270 275 

20 

GAC GCG GAG ATC GTG GCC ACG CTG GAC GCC TCC CAG CGC AAG CTC CTG 3 5 97 

Asp Ala Glu lie Val Ala Thr Leu Asp Ala Ser Gin Arg Lys Leu Leu 
280 285 290 

25 GGG CCG GTG CCG GAC AAC GTC CGG CTG GTG GAC TTC GTG CCC CTG CAC 364 5 

Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe Val Pro Leu His 
295 300 305 

GCC CTG ATG CCG ACC TGT TCG GCG ATC GTG CAC CAC GGC GGC GCC GGT 3 6 93 

3 0 Ala Leu Met Pro Thr Cys Ser Ala lie Val His His Gly Gly Ala Gly 
310 315 320 

ACC TGG CTG ACG GCC GCC GTC CAC GGC GTC CCG CAG ATC GTC CTC GGT 3 741 

Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gin lie Val Leu Gly 
35 325 * 330 335 340 

GAC CTC TGG GAC AAC CTG CTG CGC GCC CGG CAG ACA CAG GCC GCG GGC -3 7^-9- 

Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gin Thr Gin Ala Ala Gly 

345 350 355 

40 

GCG GGC CTG TTC ATC CAT CCG TCC GAG GTC ACC GCG GCC GGG CTC GGT 3 83 7 

Ala Gly Leu Phe lie His Pro Ser Glu Val Thr Ala Ala Gly Leu Gly 

360 365 370 
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GAG GGC GTG CGC CGG GTG CTG ACG GAG OCT TCC ATC CGG GCC GCC GCA 3 885 

Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser He Arg Ala Ala Ala 
375 380 385 

5 GAG CGC GTC CGG GAC GAG ATG AAT GCA GAG CCG ACG CCG GGC GAG GTC 3 93 3 

Gin Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr Pro Gly Glu Val 
390 395 400 

GTC ACG GTG CTG GAG CGG CTC GCC GCG AGC GGC GGA CGC GGA " CGA GGA 3 981 

10 Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly Arg Gly Arg Gly 
405 410 415 420 

GGC GGG AAC CAT GCG GGC TGACACGGAG CCGACCACCG GGTACGAGGA 4 02 9 

Gly Gly Asn His Ala Gly 
15 425 

CGAGTTCGCC GAGATCTACG ACGCCGTGTA CCGGGGCCGG GGCAAGGACT ACGCCGGCGA 4 08 9 

GGCGAAGGAC GTGGCGGACC TCGTGCGCGA CCGGGTGCCG GACGCGTCCT CCCTCCTGGA 414 9 

20 

CGTGGCCTGC GGCACGGGCG CGCACCTGCG GCACTTCGCC ACGCTCTTCG ACGACGCCCG 42 09 

CGGTCTCGAA CTGTCCGCGA GCATGCTGGA CATCGCCCGC TCCCGCATGC CGGGCGTGCC 42 69 

2 5 GCTGCACCAA GGGGACATGC GATCCTTCGA CCTGGGGCCA CGCGTCTCCG CGGTCACCTG 43 2 9 

CATGTTCAGC TCCGTCGGCC ACCTGGCCAC CACCGGCGAA CTCGACGCGA CGCTGCGGTG 43 8 9 

CTTCGCCCGG CACACCCGGC CCGGCGGCGT GGCCGTCATC GAACCGTGGT GGTTCCCGGA 44 4 9 

30 

GACCTTCACC GACGGCTACG TGGCGGGTGA CATCGTACGC GTCGACGGCC GGACCATCTC 45 09 

CCGGGTGTCC CACTCGGTAC GGGACGGCGG CGCCACCCGC ATGGAGATCC ACTACGTGAT 4 5 69 

3 5 CGCCGACGGC GAGCACGGTC CCCGGCACCT GGTCGAGCAC CACCGCATCA CGCTGTTCCC 462 9 

GCGGCATGCG TACACGGCCG CGTACGAGAA GGCGGGCTAC ACCGTCGAGT ACCTCGACGG _46B3- 



CGGGCCCTCG GGCCGGGGGC TGTTCGTCGG CACCCGGACG TGAACCCGCC CGCGCACCGC 47 49 

40 

CCGATCACCC TGCTCAACGC CGTTCACACG GATCACCGGA CCACGCGAAG GACCTTTCAC 48 0 9 

ATG TCG TAC GAC GAC CAC GCG GTG CTG GAA GCG ATA CTG CGG TGC GCC 4 857 
Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala He Leu Arg Cys Ala 
45 1 5 10 '15 
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GGA GGT GAC GAG CGC TTC CTG CTG AAC ACC GTC GAG GAA TGG GGA GCC 4 905 

Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala 
20 25 30 

5 GCC GAG ATC ACC GCG GCG CTC GTG GAC GAG TTG CTG TTC CGC TGC GAG 4 953 

Ala Glu lie Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu 
35 40 45 

ATC CCG CAG GTG GGC GGT GAG GCG TTC ATC GGC CTG GAC GTC CTG CAC 5001 
10 lie Pro Gin Val Gly Gly Glu Ala Phe He Gly Leu Asp Val Leu His 
50 55 60 

GGC GCC GAC CGG ATC AGC CAT GTG CTG CAG GTG ACG GAC GGC AAG CCG 5 04 9 

Gly Ala Asp Arg He Ser His Val Leu Gin Val Thr Asp Gly Lys Pro 
15 65 70 75 80 

GTC ACG TCG GCG GAA CCG GCC GGC CAG GAA CTG GGC GGC CGT ACC TGG 5 0 97 

Val Thr Ser Ala Glu Pro Ala Gly Gin Glu Leu Gly Gly Arg Thr Trp 

85 90 95 

20 

AGT TCA CGC TCA GCG ACC CTC CTG CGG GAG CTG TTC GGC CCG CCG TCC 514 5 

Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser 

100 105 110 

25 GGC CGC ACC GCG GGG GGC TTC GGC GTC TCC TTC CTG CCC GAC CTG CGC 5193 
Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg 
115 120 125 

GGC CCG CGG ACC ATG GAG GGC GCG GCC CTG GCC GCC CGC GCC ACC AAC 5 241 

3 0 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn 
130 135 140 

GTG GTG CTG CAC GCG ACG ACC AAC GAG ACG CCC CCA CTG GAC CGG CTG 52 8 9 

Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 
35 145 150 155 160 

GCC CTG CGC TAC GAG TCC GAC AAG TGG GGC GGC GTC CAC TGG TTC ACC ^23^—' 
Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr 
165 170 175 

40 

GGC CAC TAC GAC CGG CAC CTG CGG GCC GTG CGC GAC CAG GCG GTG CGG 5 3 85 

Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gin Ala Val Arg 
. 180 185 190 
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ATC CTG GAG ATC GGC ATC GGC GGC TAG GAG GAC CTG CTG CCG AGC GGC 5433 
lie Leu Glu lie Gly lie Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly 
195 200 205 

5 GCC TCA CTG AAG ATG TGG AAG GGC TAG TTC CCG CGC GGC CTG GTC TTC 54 81 

Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe 
210 215 220 

GGC GTG GAC ATC TTC GAC AGT CGG CGT GCG ACC AGC CGC GTG TCA AGA 552 9 

10 Gly Val Asp lie Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 
225 230 235 240 

CGC TCC GCG GCC CGG GAG GAC GAC CCG GAG TTC ATG CGC CGC GTC GCC 5577 
Arg Ser Ala Ala Arg Gin Asp Asp Pro Glu Phe Met Arg Arg Val Ala 
15 245 250 255 

GAG GAG CAC GGG CCG TTC GAC GTC ATC ATC GAC GAC GGC AGC CAC ATC 5 625 

Glu Glu His Gly Pro Phe Asp Val lie lie Asp Asp Gly Ser His lie 
260 265 270 

20 

AAC GCA CAC ATG CGG ACG TCG TTC TCG GTG ATG TTC CCC CAC CTG CGC 5673 
Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg 
275 280 285 

25 AAC GGC GGC TTC TAG GTC ATC GAG GAC ACC TTC ACC TCC TAG TGG CCC 5 721 

Asn Gly Gly Phe Tyr Val lie Glu Asp Thr Phe Thr Ser Tyr Trp Pro 
290 295 300 

GGG TAG GGA GGG CCA TCC GGA GCC CGG TGC CCG TCC GGA ACA ACC GCG 576 9 

3 0 Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 
305 310 315 320. 

CTG GAG ATG GTC AAG GGA CTG ATC GAC TCG GTG CAC TAG GAG GAG CGG 5 817 

Leu Glu Met Val Lys Gly Leu lie Asp Ser Val His Tyr Glu Glu Arg 
35 - 325 330 335 

CCG GAC GGC GCG GCC ACG GCC GAC TAG ATC GCC AGG AAC CTG GTC GGG --^-SWs^ 
Pro Asp Gly Ala Ala Thr Ala Asp Tyr lie Ala Arg Asn Leu Val Gly 
340 345 350 

40 

CTG CAC GCC TAG CAA ACG ACC TCG TCT TCC TCG AGA AGG GCG ATC AAC 5 913 

Leu His Ala Tyr Gin Thr Thr Ser Ser Ser Ser Arg Arg Ala lie Asn 
355 360 365 
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AAG GAG GGC GGC ATC CCC CAC ACC GTG CCC CGG GAG CCG TTC TGG AAC 5961 
Lys Glu Gly Gly lie Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn 
370 375 380 

5 GAG AAC TAGCCACGGC CGCAACCAGA GCCGGAAACC GCACCACTGT CCGCGCCACC 6 017 

Asp Asn 
385 

TCGGAACCAC CTCCAGCAAA GGACACACCG CTGTGACCGA TACGCACACC GGACCGACAC 6 077 

10 * 

CGGCCGACGC GGTACC 6 093 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

15 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 01 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

20 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gin Met Leu Arg Gly Met 
25 1 5 10 15 

Gin Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu Cys 
20 25 30 

3 0 Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala lie Arg Thr Leu 
35 40 45 

Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp Pro 
50 55 60 

3 5 

Gly Leu Gly Gly Arg lie Leu Ala Asp Arg Lys Ala Arg Cys Pro Glu 
65 70 75 80 

Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gin Tyr Val 
40 85 90 95 

Leu Pro Gly His Gin Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala Glu 
100 105 110 



4 5 Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val Asp 
115 120 125 
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Ala Trp Arg Pro Leu lie Asp Glu Val Cys Ala Gly Leu Ala Lys Gly 
130 135 140 

Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val Pro 
5 145 150 155 160 

Val Glu Val Leu Ala Arg lie Trp Gly Val Pro Glu Glu Asp Arg Ala 
165 170 175 

10 Arg Phe Gly Arg Asp Cys Arg Ala Leu Ala Pro Ala Leu Asp Ser Leu 
180 185 190 

Leu Cys Pro Gin Gin Leu Ala Leu Ser Lys Asp Met Ala Ser Ala Leu 
195 200 205 

15 

Glu Asp Leu Arg Leu Leu Phe Asp Gly Leu Asp Ala Thr Pro Arg Leu 
210 215 220 

Ala Gly Pro Ala Asp Gly Asp Gly Thr Ala Val Ala Met Leu Thr Val 
20 225 230 235 240 

Leu Leu Cys Thr Glu Pro Val Thr Thr Ala lie Gly Asn Thr Val Leu 
245 250 255 

2 5 Gly Leu Leu Pro Gly Gin Trp Pro Val Pro Cys Thr Gly Arg Val Ala 
260 265 270 

Ala Gly Gin Val Ala Gly Gin Ala Leu His Arg Ala Val Ser Tyr Arg 
275 280 285 

30 

lie Ala Thr Arg Phe Ala Arg Glu Asp Leu Glu Leu Ala Gly Cys Glu 
290' 295 300 

Val Lys Ser Gly Asp Glu Val Val Val Leu Ala Gly Ala He Gly Arg 
35 305 310 315 320 

Asn Gly Pro Ser Ala Ala Ala Pro Pro Ala Pro Pro Gly Pro Ala Ala 
325 330 335 

4 0 Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala Leu 
340 345 350 



Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gin Ala Leu 
355 360 365 
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Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg Arg 
370 375 380 

Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala Ala 
5 385 390 395 400 

Ala 



10 (2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 426 acides amines 

(B) TYPE: acide amine 

15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

2 0 Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gin Pro Leu Val 

15 10 15 

Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val 
20 25 30 

25 

Ser Gin Pro Ser Leu Ser Asp Val Val Thr Gin Ala Gly Leu Thr Ser 
35 40 45 

Val Pro Val Gly Thr Glu Ala Pro Val Glu Gin Phe Ala Ala Thr Trp 
30 50 55 60 - 

Gly Asp Asp Ala Tyr lie Gly Val Asn Ser lie Asp Phe Thr Gly Asn 
65 70 75 80 

3 5 Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met gIu Thr Met 

85 90 95 

Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp 
100 105 110 

40 

Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val lie Trp 
. 115 120 125 



Glu Pro Leu Thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala 
45 130 135 140 
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Ala His Ala Arg Leu Pro Trp Gly Gin Glu lie Thr Leu Arg Gly Arg 
145 150 155 160 

Gin Ala Phe Leu Ala Glu Arg Ala Leu Gin Pro Phe Glu His Arg Glu 
5 165 170 175 

Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys 
180 185 150 

10 Ser Phe Asp Glu Glu Met Val Thr Gly Gin Trp Thr He Asp Thr Leu 
195 200 205 

Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp 
210 215 220 

15 

Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 
225 230 235 240 

Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr He Gly Thr Ser 
20 245 250 255 

Gin Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp 
260 265 270 

2 5 Ser Leu Ala Asp Val Asp Ala Glu He Val Ala Thr Leu Asp Thr Thr 
275 280 285 

Gin Gin Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val 
290 295 300 

30 

Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala He Val 
305 310 315 320 

His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val 
35 325 330 335 

Pro Gin He He Leu Asp Thr Ser Trp Asp Thr Pro Val Arg Ala Gin 
340 345 350 

4 0 Arg Met Gin Gin Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu 
355 360 365 



Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro 
370 375 .380 

45 
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Glu Phe Arg Ala Gly Ala Glu Arg He Arg Ala Glu Met Leu Ala Met 
385 • 390 395 400 

Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu 
5 405 410 415 

His Ala Thr Gly Ala Met Ala Gly Arg Arg 
420 425 

(2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQXJES DE LA SEQUENCE: 
(A) LONGUEUR: 426 acides amines 
15 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

20 

Met Arg Val Leu Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly 
1 5 10 15 

Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 
25 20 25 30 

Val Ala Ser Gin Pro Ala Leu Ser Asp Thr He Thr Gin Ala Gly Leu 
35 40 45 

3 0 Thr Ala Val Pro Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly 
50 55 eo 

Glu He Gly Ala Asp Val Gin Lys Tyr Ser Thr Gly He Asp Leu Gly 
65 ^ 70 75 80 

35 • 

Val Arg Ala Glu Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr 

85 90 95 - 

Thr Leu Val Pro Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val 
40 100 105 110 

Asp Gly Leu Val Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu He Leu 
115 120 125 



45 Trp Glu His Phe Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly 
130 135 140 
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Thr Pro His Ala Arg Val Leu Trp Gly Ser Asp Leu He Val Arg Phe 

145 150 155 . 160 

Arg Arg Asp Phe Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg 
5 165 170 . 175 

Glu Asp Pro Met Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly 
180 185 190 

10 Ser Thr Phe Asp Glu Glu Leu Val Thr Gly Gin Trp Thr He Asp Pro 
195 200 205 

Leu Pro Arg Ser Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met 
210 215 220 

15 

Arg Tyr Val Pro Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg 
225 230 235 240 

Gin Arg Ala Arg Arg Pro Arg He Cys Leu Thr Leu Gly Val Ser Ala 
20 245 250 255 

Arg Gin Thr Leu Gly Asp Gly Val Ser Leu Ala Glu Val Leu Ala Ala 
260 265 270 

2 5 Leu Gly Asp Val Asp Ala Glu He Val Ala Thr Leu Asp Ala Ser Gin 
275 280 285 

Arg Lys Leu Leu Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe 
290 295 300 

30 

Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala He Val His His 
305 310 315 320 

Gly Gly Ala Gly Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gin 
35 • 325 330 335 

He Val Leu Gly Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gin Thr 
340 345 350 

4 0 Gin Ala Ala Gly Ala Gly Leu Phe He His Pro Ser Glu Val Thr Ala 
355 360 365 

Ala Gly Leu Gly Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser He 
370 375 380 

45 
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Arg Ala Ala Ala Gin Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr 
385 390 395 400 

Pro Gly Glu Val Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly 
5 405 410 415 

Arg Gly Arg Gly Gly Gly Asn His Ala Gly 
420 425 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 3 86 acides amines 
15 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

20 

Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala He Leu Arg Cys Ala 
1 5 

Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala 
25 20 25 30 

Ala' Glu He Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu 
35 40 45 

3 0 He Pro Gin Val Gly Gly Glu Ala Phe He Gly Leu Asp Val Leu His 
50 55 60 

Gly Ala Asp Arg He Ser His Val Leu Gin Val Thr Asp Gly Lys Pro 
65 70 75 80 

35 

val Thr Ser Ala Glu Pro Ala Gly Gin Glu Leu Gly Gly Arg Thr Trp 
85 90 95 

Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser 
40 100 105 110 

Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg 
115 120 125 



4 5 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn 
130 135 140 
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Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 
145 . 150 155 160 

Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr 
5 165 170 175 

Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gin Ala Val Arg 
180 185 190 

10 He Leu Glu He Gly He Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly 
195 200 205 

Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe 
210 215 220 

15 

Gly Val Asp He Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 
225 230 235 240 

Arg Ser Ala Ala Arg Gin Asp Asp Pro Glu Phe Met Arg Arg Val Ala 
20 245 250 255 

Glu Glu His Gly Pro Phe Asp Val He He Asp Asp Gly Ser His He 
260 265 270 

2 5 Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg 
275 280 285 

Asn Gly Gly Phe Tyr Val He Glu Asp Thr Phe Thr Ser Tyr Trp Pro 
290 295 300 

30 

Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 
305 310 315 320 

Leu Glu Met Val Lys Gly Leu He Asp Ser Val His Tyr Glu Glu Arg 
35 • 325 • 330 335 

Pro Asp Gly Ala Ala Thr Ala Asp Tyr He Ala Arg Asn Leu Val Gly 
340 345 350 

4 0 Leu His Ala Tyr Gin Thr Thr Ser Ser Ser Ser Arg Arg Ala He Asn 
355 360 365 



Lys Glu Gly Gly He Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn 
370 375 380 
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Asp Asn 
385 

(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

5 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 738 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 
10 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomicpae) 

(vi) ORIGINE: 

15 (A) ORGANISME: S treptomyces antibioticus 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .738 

20 * (D) AUTRES INFORMATIONS :/gene= "oleM" 

/nOte= "SEQ ID NO 15 DE 3992 A 4729" 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: mat_peptide 
25 (B) EMPLACEMENT:! 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 

3 0 ATG CGG GCT GAC ACG GAG CCG ACC ACC GGG TAC GAG GAC GAG TTC GCC 4 8 

•Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala 
15 10 • 15 

GAG ATC TAC GAC GCC GTG TAC CGG GGC CGG GGC AAG GAC TAC GCC GGC 96 
3 5 Glu lie -Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly 
20 25 30 

GAG GCG AAG GAC GTG GCG GAC CTC GTG CGC GAC CGG GTG CCG GAC GCG 144 
Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala 
40 35 40 45 

TCC TCC 'CTC CTG GAC GTG GCC TGC GGC ACG GGC GCG CAC CTG CGG CAC 192 
Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His 
50 55 60 

45 
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. TTC GCC ACG CTC TTC GAG GAG GCC CGC GGT CTC GAA CTG TCC GCG AGC 24 0 

Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser 
SS 70 75 80 

5 ATG CTG GAG ATC GCC CGC TCC CGC ATG CCG GGC GTG CCG CTG CAC CAA 28 8 

Met Leu Asp He Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gin 
85 90 55 

GGG GAC ATG CGA TCC TTC GAC CTG GGG CCA CGC GTC TCC GCG GTC ACC 336 
10 Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr 
100 105 110 

TGC ATG TTC AGC TCC GTC GGC CAC CTG GCC ACC ACC GCC GAA CTC GAC 3 84 

Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp 
15 115 120 125 

GCG ACG CTG CGG TGC TTC GCC CGG CAC ACC CGG CCC GGC GGC GTG GCC 4 32 

Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala 
130 135 140 

20 

GTC ATC GAA CCG TGG TGG TTC CCG GAG ACC TTC ACC GAC GGC TAC GTG 480 
Val He Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 
145 150 ^ 155 160 

25 GCG GGT GAC ATC GTA CGC GTC GAC GGC CGG ACC ATC TCC CGG GTG TCC 52 8 

Ala Gly Asp He Val Arg Val Asp Gly Arg Thr He Ser Arg Val Ser 
165 170 175 

CAC TCG GTA CGG GAC GGC GGC GCC ACC CGC ATG GAG ATC CAC TAC GTG 576 
3 0 His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu He His Tyr Val 
180 185 ISO 

ATC GCC GAC GCC GAG CAC GGT CCC CGG CAC CTG GTC GAG CAC CAC CGC 624 
He Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg 
35 .'i95 200 205 . 

ATC ACG CTG TTC CCG CGG CAT GCG TAC ACG GCC GCG TAC GAG AAG GCG .^.=B3^'^ 
He Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala 
210 215 220 

40 

GGC TAC ACC GTC GAG TAC CTC GAC GGC GGG CCC TCG GGC CGG GGG CTG 720 
Gly Tyr Thr Val Glu Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 
225 230 235 240 
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TTC GTC GGC ACC CGG ACG 
Phe Val Gly Thr Arg Thr 
245 

5 

(2) INFORMATIONS POUR LA SEQ ID NO : 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 246 acides amines 
10 (B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 

15 

Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala 
1 5 10 15 

Glu He Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly 
20 20 25 30 

Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala 
35 40 45 

2 5 Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His 
50 55 60 

Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser 
65 70 75 80 

30 

Met Leu Asp He Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gin 
85 90 95 

Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr 
35 100 105 110 

Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp 
115 120 125 

4 0 Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala 
130 135 140 

Val He Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 
145 150 155 160 

45 



738 
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Ala Gly Asp lie Val Arg Val Asp Gly Arg Thr lie Ser Arg Val Ser 
165 170 175 

His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu lie His Tyr Val 
5 180 185 190 

lie Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg 
195 200 205 

10 lie Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala 
210 215 220 

Gly Tyr Thr Val Glu " Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 
225 230 235 240 

15 

Phe Val Gly Thr Arg Thr 
245 

2 0 (2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

25 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION:' lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

30 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: . 
TCCTCGATGG AGACCTGCC 

3 5 

(2) INFORMATIONS POUR LA SEQ ID NO : 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 19 paires de bases 

4 0 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: Autre acide nucleique 
4 5 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 
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(xi) description" DE LA SEQUENCE: SEQ ID NO: 23: 
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GAGACCATGC CCAGGGAGT 19 
5 (2) INFORMATIONS POUR LA SEQ ID NO : 24 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

15 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ. ID NO: 24: 
TCTGGGAGCC GCTCACCTT 19 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 
25 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
3 0 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 

3 5 GACGAGGCCG AAGAGGTGG 19 

(2) INFORMATIONS POUR LA SEQ ID NO: 26: — : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

4 0 (A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



4 5 (ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 26: 
GCACACCGGA ATGGATGCG 

(2) INFORMATIONS POUR LA SEQ ID NO : 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 
10 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
15 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO : 27: 
2 0 CCGTCGAGCT CTGAGGTAA 

(2) INFORMATIONS POUR LA SEQ ID NO : 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

2 5 (A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple • 

(D) CONFIGURATION: lineaire 

3 0 (ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 

35 

GCCCGAGCCG CACGTGCGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

40 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 0 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

45 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
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(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 29: 

5 

TGCACGCGCT GCTGCCGACC 2 0 

(2) INFORMATIONS POUR LA SEQ ID NO : 30: 

10 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



15 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



20 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 30: 

TTGGCGAAGT CGACCAGGTC 2 0 

(2) INFORMATIONS POUR LA SEQ ID NO : 31: 

25 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
3 0 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

3 5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 31: 
GCCGCTCGGC ACGGTGAACT TCA 23 

4 0 (2) INFORMATIONS POUR LA SEQ ID NO : 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

45 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECXJLE : Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
ATGCGCGTCG TCTTCTCCTC CATG 
(2) INFORMATIONS POUR LA SEQ ID NO : 33: 



10 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 

20 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 
TCATCGTGGT TCTCTCCTTC C 

2 5 (2) INFORMATIONS POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE : nucleotide 

3 0 (C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 
GGAATTCATG ACCACGACCG ATC 

40 

(2) INFORMATIONS POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 28 paires de bases 
4 5 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc "OLIGONUCLEOTIDE" 

5 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 
CGCTCCAGGT GCAATGCCGG GTGCAGGC 2 8 

10 

(2) INFORMATIONS POUR LA SEQ ID NO : 36: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION; lineaire 

(ii) TYPE DE MOLECXXLE : Autre acide nucleique 
2 0 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 

2 5 GATCACGCTC TTCGAGCGGC AG 22 

(2) INFORMATIONS POUR LA SEQ ID NO : 37: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

3 0 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 5 (iii' TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



40 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 

GAACTCGGTG GAGTCGATGT C 21 

(2) INFORMATIONS POUR LA SEQ ID NO : 38: 

4 5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 
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(B) TYPE : nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

5 (ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 38: 

10 

GTTGTCGATC AAGACCCGCA C 

(2) INFORMATIONS POUR lA SEQ ID NO : 39: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



20 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 



25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 39: 

CATCGTCAAG GAGTTCGACG GT 

(2) INFORMATIONS POUR LA SEQ ID NO : 40: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 5 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
* (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 
TGCGCAGGTC CATGTTCACC ACGTT 
45 (2) INFORMATIONS POUR LA SEQ ID NO: 41: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
5 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleigue 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

10 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 41: 
GCTACGCCCT GGAGAGCCTG 2 0 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 42: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE* 



25 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 42: 
GTCGCGGTCG GAGAGCACGA C 21 

30 

(2) INFORMATIONS POUR LA SEQ ID NO: 43: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 21 paires de bases 
3 5 ; (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire —=7 : 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
40 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 43: 



45 GCCAGCTCGG CGACGTCCAT C 



21 
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(2) INFORMATIONS POUR LA SEQ ID NO : 44: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 19 paires de bases 
5 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
10 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 44: 
15 CGACGAGGTC GTGCATCAG 



(2) INFORMATIONS POUR LA SEQ ID NO: 45: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
2 0 (A) LONGUEUR: 56 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

25 (ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



30 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 45: 
AATTGATCAA GGTGAACACG GTCATGCGCA GGATCCTCGA GCGGAACTCC ATGGGG 
(2) INFORMATIONS POUR LA SEQ ID NO : 46: 



3 5 (i)/CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 56 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

40 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc ^ "OLIGONUCLEOTIDE" 



45 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 46: 
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CCCCATGGAG TTCCGCTCGA GGATCCTGCG CATGACCGTG TTCACCTTGA TCAATT 



10 



(2) INFORMATIONS POUR LA SEQ ID NO: 47: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 47: 

AACTCGGTGG AGTCGATGTC GTCGCTGCGG AA 
(2) INFORMATIONS POUR LA SEQ ID NO: 48: 

20 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2 7 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

2 5 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 

30 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 48: 
CAATATAGGA AGGATCAAGA GGTTGAC 

3 5 (2) INFORMATIONS POUR LA SEQ ID NO : 49: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 9 paires de bases 

(B) TYPE: nucleotide 

40 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 49: 
TCCGGAGGTG TGCTGTCGGA CGGACTTGTC GGTCGGAAA 
5 (2) INFORMATIONS POUR LA SEQ ID NO : 50: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE; nucleotide 

10 (C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 

15 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 50: 

20 

AGGAGCACTA GTGCGGGTAC TGCTGACGTC CTT 
(2) INFORMATIONS POUR LA SEQ ID NO : 51: 

2 5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 7 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 



30 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE"- 



35 (xi); DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 51: 

GGGGGATCCC ATATGCGGGT ACTGCTGACG TCCTTCG 
(2) INFORMATIONS POUR LA SEQ ID NO: 52: 

40 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 7 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
4 5 (D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: Autre acide nucleic[ue 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 52: 
GAAAAGATCT GCCGGCGTGG CGGCGCGTGA GTTCCTC 
(2) INFORMATIONS POUR LA SEQ ID NO: 53: 



10 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 27 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 
15 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE' 

20 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 53: 
AGCGGCTTGA TCGTGTTGGA CCAGTAC 
25 (2) INFORMATIONS POUR LA SEQ ID NO: 54: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 27 paires de bases 

(B) TYPE: nucleotide 

3 0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 54: 
GGCCTATGTG GACTACGTGT TGAACGT 

40 

(2) INFORMATIONS POUR LA SEQ ID NO : 55: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 31 paires de bases 
4 5 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
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(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

5 

{xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 55: 
AACGCCTCGT CCTGCAGCGG AGACACGAAC A 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 56: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 27 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 
2 0 (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 56: 

2 5 TTCGCTCCCC GATGAACACA ACTCGTA 

(2) INFORMATIONS POUR LA SEQ ID NO : 57: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

3 0 (A) LONGUEUR: 35 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 5 (ii)- TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desC = "OLIGONUCLEOTIDE" 



40 



31 



27 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 57: 
GAAGGAGATA TACATATGCG CGTCGTCTTC TCCTC 3 5 

(2) INFORMATIONS POUR LA SEQ ID NO : 58: 



45 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 32 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

5 (ii) TYPE DE MOLECCFLE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



.10 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 58: 
CGGGATCCTC ATCGTGGTTC TCTCCTTCCT GC 
(2) INFORMATIONS POXJR LA SEQ ID NO: 59: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



20 



(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



2 5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 59: 

CGGGTACCAT GCGCGTCGTC TTCTCCTCCA TG 
( 2 ) INFORMATIONS POUR LA SEQ ID NO: 60: 

30 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 29 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

3 5 / (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" 



40 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 60: 
CGGGTACCTC ATCGTGGTTC TCTCCTTCC 



4 5 (2) INFORMATIONS POUR LA SEQ ID NO : 61: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 13 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 
5 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 

(ix) CARACTERISTIQUE: 
10 (A) NOM/CLEr Peptide 

(B ) EMPLACEMENT : 1 . . 13 

(D) AUTRES ; INFORMATIONS :/note= "SEQ ID NO 11 DE 38 A 50" 



15 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 61: 
Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gin Ala 



1 



5 10 



